首页 > 编程入门文章详情

＜爬虫＞ requests和selenium的区别 / 为什么有的网站数据requests爬不下来

编程入门行业动态更新时间:2024-10-15 14:17:52

＜<a href=https://www.elefans.com/category/jswz/34/1770264.html style= 爬虫＞ requests和selenium的区别 / 为什么有的网站数据requests爬不下来"/>

＜爬虫＞ requests和selenium的区别 / 为什么有的网站数据requests爬不下来

有的网页中的信息需要执行js才能显现

通过requests只能爬取原网页代码
通过selenium才可以爬取执行 js 后的网页数据，实现“所见即所得”

注意：要等网页加载完selenium才能爬取成功否则也无法爬出数据

Selenium 的缺点：

速度慢。每次运行爬虫都打开一个浏览器，如果没有设置，还会加载图片、JS等等一大堆东西。
占用资源太多。
对网络的要求会更高。 Selenium 加载了很多可能对您没有价值的补充文件（如css，js和图像文件）。与仅仅请求您真正需要的资源（使用单独的HTTP请求）相比，这可能会产生更多的流量。
爬取规模不能太大。

更多推荐

＜爬虫＞ requests和selenium的区别 / 为什么有的网站数据requests爬不下来

本文发布于:2024-02-26 11:06:32，感谢您对本站的认可！

本文链接:https://www.elefans.com/category/jswz/34/1702263.html

版权声明:本站内容均来自互联网，仅供演示用，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。

爬虫区别数据网站 selenium

上一篇：爬虫一些本该输出为中文的字段输出为none
下一篇： Unity 攀爬系统

发布评论取消回复

评论列表（有 0 条评论）

热门文章