首页 > 编程入门文章详情

爬取心灵鸡汤

编程入门行业动态更新时间:2024-10-19 02:17:05

爬取<a href=https://www.elefans.com/category/jswz/34/1759761.html style= 心灵鸡汤"/>

爬取心灵鸡汤

网页截图

Python代码

import requests
import reurl = '/'
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}text = requests.get(url, headers=headers).content.decode()
for i in range(64783, 64793):page = re.findall(r'div id="humorContent_{}" class="pic_text1"(.*?)<p>'.format(str(i)), text, re.DOTALL)print(page[0])print('*' * 40)

效果截图

总结

网页本身存在一定的问题，而我的正则表达式应该是没有问题的；现在的不足之处就是还不会翻页爬取数据，存储以及整理数据，希望今后能因为兴趣再更上一层楼。

更多推荐

爬取心灵鸡汤

本文发布于:2024-02-27 18:04:25，感谢您对本站的认可！

本文链接:https://www.elefans.com/category/jswz/34/1707675.html

版权声明:本站内容均来自互联网，仅供演示用，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。

心灵鸡汤

上一篇：转发心灵鸡汤
下一篇：心灵鸡汤2

发布评论取消回复

评论列表（有 0 条评论）

热门文章