selenium IE浏览器爬虫小结|电子爱好者

admin管理员组
文章数量:1565353

1、下载IEDriverServer

IE驱动地址： http://selenium-release.storage.googleapis/index.html?path=3.141/

进入索引页，首先选择版本号，IEDriverServer的版本号和Selenium的版本号一定要一致，因为我选择的是selenium-3.30，所以IEDriverServer也选择的是3.30版本的。注意win32和X64的区别。打开后的页面如下所示：

2、IEDriverServer.exe驱动IE11遇到的问题及解决方法

IE浏览器版本号:

查询资料得到以下解决方法,按照此法,立刻解决问题.为加深印象,特此记录,方法转自此博客,https://wwwblogs/feiquan/p/8531618.html

一共需要做4处修改:

1.缩放100%

2.针对windows vista和windows 7上的IE7或者更高的版本，必须在IE选项设置的安全页中，4个区域的启用保护模式的勾选都去掉（或都勾上），即保持四个区域的保护模式是一致的。如下图所示：

3.针对IE10和更高的版本，必须在IE选项设置中的高级页中，取消增强保护模式(一般默认就没有勾选,这里确认下即可)。如下图所示：

4.针对IE11，需要修改注册表。

如果是32位的windows，key值为

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Internet
Explorer\Main\FeatureControl\FEATURE_BFCACHE

如果是64位的windows，key值为

HKEY_LOCAL_MACHINE\SOFTWARE\Wow6432Node\Microsoft\Internet
Explorer\Main\FeatureControl\FEATURE_BFCACHE

如果key值不存在，就添加。之后在key内部创建一个iexplorer.exe，DWORD类型，值为0，我的windows是64位的，修改后的注册表如下图所示

以上4处,修改设置完成后,即可解决

3、python+selenium调用浏览器（IE-Chrome-Firefox）实现爬虫功能

首先，得先明确，为什么要采用selenium来模拟登陆网页。最主要的原因我认为还是在于通过这种模拟登录方式获取的页面html代码，可以把js里的内容也获取到，而通过urllib方式模拟登录的方式虽然也可以伪装成浏览器的形式获取页面html代码，但是这里面的js，css代码是没有的，也就是没有动态的内容，达不到全面抓取数据的目的；当然除了selenium这种方式外，还有其他的途径也能获取到js等动态代码，这里先不做介绍了，以后再分别细说。

说了selenium的优点，就需要再强调一下它的不足，selenium调用浏览器时，跟我们手动打开浏览器效果一样，你可以想想自己打开浏览器时的镜像，从开启到加载完毕，要耗费好几秒时间，对于一般的脚本来说，好几秒可是很长的时间了，但是它就是这么傲娇，加载不完就别想玩后面的；如果你只是想偶尔打开一次抓一次，几秒倒也没什么，但如果你要循环执行的话，这个方法的效率就是低的不要不要的了。

总之，还是要开发人员自己权衡利弊，决定是否使用。

好了，接下来我们就来介绍python环境下，如何利用selenium体统的webdriver来浏览三大常用浏览器：IE，Chrome，Firefox。

1 利用Chrome浏览器，安装的chrome浏览器是没有没有提供现成的driver的，因此需要我们自己下载ChromeDriver.exe，这里可以有下载地址，下载完后把它放到chrome浏览器所在的安装目录下就可以了，保证让他跟chrome.exe呆一起就可以了。相关脚本如下
from selenium import webdriver
from selenium.webdrivermon.keys import Keys
import os
chromedriver = "D:\Program Files\ChromeGAE\Chrome\chromedriver.exe"
os.environ["webdriver.chrome.driver"] = chromedriver
browser = webdriver.Chrome(chromedriver)
url = "http://www.baidu"
browser.get(url)

这样基本就可以直接用了。
2 利用IE浏览器，IE浏览器和chrome比较相似，也需要我们自己去找到Driver，名字是IEDriverServer.exe，这个随便一百度也能找到，就不放连接了，下载后跟chrome那里一样，也是放到ieexplore.exe的同级目录下，这个一般是在C:\Program Files\Internet Explorer下，毕竟是系统自带的嘛。脚本如下

from selenium import webdriver
from selenium.webdrivermon.keys import Keys
import os

IEdriver= "C:\Program Files\Internet Explorer\IEDriverServer.exe"
os.environ["webdriver.ie.driver"] = IEdriver
browser = webdriver.Ie(IEdriver)
url = "http://www.baidu"
browser.get(url)

3 利用Firefox浏览器，firefox这个相比起前面两个就方便多了，果然是亲开发的良心浏览器，自带driver光环，拿来就可以用。
from selenium import webdriver
from selenium.webdrivermon.keys import Keys
<pre name="code" class="html">browser = webdriver.Firefox()
<pre name="code" class="html">url = "http://www.baidu"
<pre name="code" class="html">browser.get(url)
是不是方便多了，但是！但是！但是！这里不得不说的是，firefox也是有大坑的，firefox会经常更新，一单更新了，你的selenium没跟到位，那就费了，银次你需要关闭firefox的自动更新，并且将firefox保持在一个较低的版本（45以前的应该还是可以的），我当初遇到的问题就是firefox更新后，脚本可以调用浏览器打开，但是却打不开url，各种找原因，看到其他网友就说是版本太高的原因，方法就是再找到老版本的firefox安装。
好了，就说这些了，如有不对之处还望多批评指正。
————————————————
版权声明：本文为CSDN博主「玲珑算局」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn/lukaishilong/article/details/51888765

本文标签：爬虫小结浏览器 selenium

版权声明：本文标题：selenium IE浏览器爬虫小结内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1726424973a1070266.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

selenium IE浏览器爬虫小结

更多相关文章

centos上面谷歌浏览器安装

谷歌浏览器（Chrome）无法调试Flex程序

ubuntu系统安装谷歌浏览器和搜狗输入法

04 cefsharp谷歌浏览器多开页面的实现

【NanoPi Neo2】在NanoPi Neo2上安装谷歌浏览器

Chrome谷歌浏览器OTS parsing error: invalid version tag

谷歌浏览器扩展程序报错 The message port closed before a response was received.

谷歌浏览器中文下载

谷歌Chrome浏览器内直接打开编辑保存 Word、Excel、PPT 文档，可离线部署！

下载google浏览器稳定版（最新）

CefSharp 集成谷歌浏览器详解（三）--官网示例解析2 CefSettings 介绍

【12306刷票必备！！！】12306订票助手----无所不能的谷歌浏览器chrome插件

ubantu下谷歌浏览器安装包

Selenium模拟操作浏览器(谷歌和火狐)

关于chrome浏览器更新后，谷歌插件无法给网页嵌套的iframe植入cookie的问题

Chrome浏览器自带谷歌翻译用不了的解决方法

kindeditor用谷歌浏览器上传图片出现 “上传错误 ”，在官网上就这样。{&quot;error&quot;:0,&quot;url&quot;:&quot;ke4attachedW02009112452451

Linux Ubuntu中安装Chrome浏览器

vue2 + el-upload 在谷歌浏览器点击无效

地底爬虫人访谈

发表评论

推荐文章

电脑提示msvcp140.dll丢失的解决方法,一键修复msvcp140.dll丢失

购买阿里云服务器后，在哪里查看服务器信息？

wps自动云同步的问题

无法访问 请与这台计算机,我们办公室两台电脑想连接一个共享的打印机，但是连接的时候，总是显示无法访问，请与这台计算机的管理员联系，应该怎么设置啊...

android 8.0后打开wifi热点以及更改热点帐号密码，打开移动数据的方法

热门文章

期刊｜认知科学领域期刊《Trends in Cognitive Sciences》

win7系统修复工具_联想出品30多款系统快速修复工具，为你的电脑保驾护航！

win1011系统node安装详细步骤，及安装失败解决方法-不运行安装包，直接指定运行目录

文件系统管理-文件系统常用命令-挂载光盘和U盘

在linux系统下挂接(mount)光盘镜像文件、移动硬盘、U盘以及Windows网络共享和UNIX...

N1盒子内置双系统最新 V3.9.9.5 默认1920x1080分辨率版发布

怎么设置计算机网络打印机共享,打印机共享设置，告诉你打印机共享怎么设置...

无法启动游戏 因为计算机,win7电脑无法启动游戏怎么办？

电脑上出现应用程序无法正常启动0xc0000142的解决方法

各种多媒体软件安装教程

最新文章

基于YOLOv8YOLOv7YOLOv6YOLOv5的行人跌倒检测系统（深度学习+UI界面+完整训练数据集）

【工具】Windows下常用录屏软件

武林外传书生版单机安装教程+GM工具+虚拟机一键端

电脑大神偷偷藏着的u盘恢复数据5个方法，现在公开

硬件知识：U盘缩水是怎么回事，如何恢复U盘真实容量？

联想工程师专用小工具（共计204款）

网络配置切换神器 - NetSetman介绍

专注于Win7系统清除附带推广和工具

U盘文件夹为空恢复方法，恢复U盘的空白文件夹

备份数据选u盘还是硬盘？数据丢失又该如何恢复？

FL Studio21.2.3.4004中文版一键安装版专业版水果FL Studio2024最新完整版免费下载

逆向工程第007篇：扫雷辅助的研究——0秒实现一键自动扫雷

win7 内存补丁_封装Win7系统定制私人GHO包必须要做的55个优化步骤

U盘跨机使用难题：打不开的困境与数据恢复之道

u盘文件夹被隐藏怎么恢复正常？

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

kindeditor用谷歌浏览器上传图片出现 “上传错误 ”，在官网上就这样。{"error":0,"url":"ke4attachedW02009112452451

无法访问请与这台计算机,我们办公室两台电脑想连接一个共享的打印机，但是连接的时候，总是显示无法访问，请与这台计算机的管理员联系，应该怎么设置啊...

无法启动游戏因为计算机,win7电脑无法启动游戏怎么办？

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载