爬取今日头条新闻selenium|电子爱好者

admin管理员组
文章数量:1660700

from selenium import webdriver, common
import time
# 爬取今日头条的新闻
browser = webdriver.Chrome()
browser.maximize_window()
browser.get("https://www.toutiao/ch/news_finance/")
time.sleep(3)
# 获取13条网页文章
index = 1
while index < 13:
try:

# 得到网页上显示的新闻的连接
web = browser.find_element_by_xpath("/html/body/div/div[4]/div[2]/div[2]/div/div/div/ul/li["+str(index)+"]/div/div[1]/div/div[1]/a")
print(web.get_attribute("href"))

# 模拟点击
web.click()

# 由于打开了新的连接该步骤是让selenium跳转到新的页面操作
pagenum = browser.window_handles
browser.switch_to.window(pagenum[1])
time.sleep(5)
# 操作js命令注意return
title = None
try:
# 如果使用find element by xxx 会出现异常，所以折中选择js操作
title = browser.execute_script("return document.getElementsByClassName('article-title')[0].innerText")
except common.exceptions.WebDriverException as e:
print("标题有异常", e)
print(title)
browser.close()
browser.switch_to.window(pagenum[0])
time.sleep(3)
# 当流量的标题大于4个后，拖动滚动条
browser.execute_script("window.scrollTo(0," + str(index * 100) + ")")
time.sleep(2)
except common.exceptions.WebDriverException as e:
# 当有跳转的时候直接刷新页面从头开始爬取
print("有跳转", e)
browser.get("https://www.toutiao/ch/news_finance/")
index = 0
time.sleep(5)
# 滚轴顶头
browser.execute_script("window.scrollTo(0, 0)")
finally:
index += 1

本文标签：头条今日新闻 selenium

版权声明：本文标题：爬取今日头条新闻selenium 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1729881422a1215967.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

爬取今日头条新闻selenium

更多相关文章

今日头条品质优化 - 图文详情页秒开实践

Python---分页爬取今日头条标题

今日头条API

（android高仿系列）今日头条 --新闻阅读器 （二）

GitHub：今日头条机器人

高仿今日头条超级今日头条带手移动端商业版（GBK+UTF）网站模板头条资讯源码 Discuz模板

java新闻爬虫_java实现简单的爬虫之今日头条

Android Studio初学者实例：RecyclerView学习--模仿今日头条

python爬取今日头条手机app广告_今日头条App广告采集器的实现

头条限流是什么原因_今日头条为什么会被限流 今日头条封禁有期限吗

抓取今日头条新闻

ai爆文写作技巧，小白轻松上手今日头条掘金方法，可多平台

Axure新闻资讯APP客户端原型图，今日头条内容社交，RP成品原型197页

【vue前端项目实战案例】Vue3仿今日头条App

可狱可囚的爬虫系列课程 10：在网站中寻找 API 接口（今日头条热榜爬取）

今日头条接口

python 刷手机今日头条金币_刷金币全自动脚本 | 让Python每天帮你薅一个早餐钱（送源码）...

playwrite今日头条自动发帖

用requests包爬取今日头条新闻标题

python爬取今日头条瀑布流_连续动作：滚屏采集瀑布流网页—以头条新闻为例

发表评论

推荐文章

网络木马丛生安全软件如何工作

增霸卡传输掉线无法登录再次登录时间长

输入法漏洞总结篇

解决虚拟机能够ping通本机，但是无法上网问题

使用dbms_stat采集统计信息时estimate_percent和cascade的默认值

热门文章

Android实训案例（六）——四大组件之一BroadcastReceiver的基本使用，拨号，短信，SD卡，开机，应用安装卸载监听

破解软件 难逃宿命

树莓派3B+安装系统（Raspbian）以及配置环境

USB网卡驱动分析（rt8152）

极点五笔设置经验

linux设置cpu工作模式,Linux-cpufrequtils查看和修改CPU频率GHz

linux怎么变压缩边删除文件,Linux文件压缩命令，复制，删除，与移动

ORBSLAM3 --- 优化（一）：g2o优化中的节点与边的定义-G2oTypes.h、G2oTypes.cc解析

视觉SLAMch7 课后题

车辆安装角标定

最新文章

Unraid安装KMS Docker激活Windows+Office

VAMT3管理工具:查看哪些客户端使用kms进行了激活

【无标题】win11 kms 所请求的操作需要提升权限。 页面不可用你的IT管理员已限制对此应用的某些区域的访问，并且你尝试访问的项目不可用。有关详细信息，请与IT支持人员联系。

在Ubuntu中自动运行KMS服务

激动！一直困扰的“无法使用KMS服务”终于解决啦

教你一段代码激活计算机系统

如何激活Windows server服务器

KMS知识管理系统：企业智慧的引擎

KMSpico无法安装问题解决

HEU_KMS_Activator_v11.1.0

10款你一定不知道的实用工具！

visio 2010 激活方法

激活VISIO2019专业版

KMS知识管理系统：提升企业知识管理与协作效率的利器

Merlin部署KMS

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

（android高仿系列）今日头条 --新闻阅读器（二）

头条限流是什么原因_今日头条为什么会被限流今日头条封禁有期限吗

破解软件难逃宿命

【无标题】win11 kms 所请求的操作需要提升权限。页面不可用你的IT管理员已限制对此应用的某些区域的访问，并且你尝试访问的项目不可用。有关详细信息，请与IT支持人员联系。

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载