python爬虫（四）cookie模拟登录和反反爬案例|电子爱好者

admin管理员组
文章数量:1567915

处理不被信任证书的网站

SSL证书：数字证书的一种，配置在服务器上面的，类似于驾驶证、护照和营业执照的电子副本。因为配置在服务器上，也称为SSL服务器证书。

SSL证书的特点：遵循了SSL协议，由收信任的数字证书颁发机构CA，验证身份之后颁发的证书，同时具有服务器身份验证和数据传输加密功能。
SSL证书的发展历程：
为啥网站会出现SSL证书？具有服务器身份验证和数据传输加密的功能，https是http的安全版本，是在http的基础上添加的安全阶层（ssl层），https在传输的时候，就有ssl加密和解密的过程，能够保证数据传送的安全性，大多数网站用的都是https，http用的就比较少了，打开http开头的网站会提示不安全。https = http + ssl
http升级成https时，需要ssl证书，一旦有了ssl证书后，数据传输的安全有了保证，就成了https。ssl证书得到有两种方法：一是自己做，大型的公司有专门的团队去做；二是找专业的第三方平台去做。自己做的话需要找专门的机构去认证，否则不会被信任。有些网站不被信任可能就访问不了，但是像税务网站，一般没有需求的人也不会去访问，某种程度上数据更安全了。

测试网站：
https://inv-veri.chinatax.gov/
打开后左侧显示“不安全”三个字，但是也是https开头的，是因为所做的证书没有去认证。

需求：向一个不被SSl信任的网站发起请求爬取数据
目标url：https://inv-veri.chinatax.gov/
如果单纯的用以前的requests模块就爬取不了该种网站，requests模块在向网站发起请求的时候会自动的检测数字证书，发现数字证书是不被信任的，就会抛出异常。代码如下：

import requests
# 目标url
url = 'https://inv-veri.chinatax.gov/'
headers = {
   
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36 Edg/92.0.902.62'
}
res = requests.get(url, headers=headers)
print(res.text)

返回的结果

    raise SSLError(e, request=request)
requests.exceptions.SSLError: HTTPSConnectionPool(host='inv-veri.chinatax.gov', port=443): Max retries exceeded with url: / (Caused by SSLError(SSLError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:852)'),))

可以看到返回的是SSLError，证书错误。

如果想正常爬取，那就不让re

本文标签：爬虫案例 Python 反反爬 cookie

版权声明：本文标题：python爬虫（四）cookie模拟登录和反反爬案例内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1726251114a1062487.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

python爬虫（四）cookie模拟登录和反反爬案例

处理不被信任证书的网站

更多相关文章

Python错误卸载导致无法重装之残留卸载

爬虫:JS逆向前置准备

涉密计算机打印机共享案例分析,又碰到2个打印机无法共享的案例(打印机共享的四个步骤)...

涉密计算机打印机共享案例分析,案例教程｜兼收并蓄，有线打印机无线共享实战...

分分钟搞定python破解无线wifi

python应用程序无法正常启动0x00000ba_应用程序无法正常启动0xc000012d?怎么解决？...

python应用程序无法正常启动0xc000007b_应用程序无法正常启动0xc000007b解决方法

python无法正常启动0xc000007b_应用程序无法正常启动0xc000007b怎么解决(最全)

【Java 多线程】多线程带来的的风险-线程安全、多线程五个经典案例

《树莓派Python编程指南》——3.3 控制程序流程

CREO：CREO软件的简介、安装(七大步骤)、学习路线大全(CREO软件各模块界面解释—菜单栏&amp;快速栏&amp;工作区、草绘零件工程图装配设计讲解)、案例应用(几十个案例)之详细攻略

Python打包成exe终极方案，赶紧收藏吧

〖Python 数据库开发实战 - MongoDB篇②〗- Mac环境下的MongoDB数据库安装

windows系统下Python环境的搭建

成功解决python.exe 无法找到入口 无法定位程序输入点

Postman调接口时获取Chrome浏览器Cookie数据携带发送

Asp.Net-租车管理系统-30020（免费领源码+开发文档）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案

python检测U盘的插入，以及进行自动复制文件并写入文件

使用python的email、smtplib、poplib模块收发邮件_poplib离线包(1)

python教程(6完结)

发表评论

推荐文章

手机APP游戏软件资源下载站源码软件盒子整站源码

Inventor 卸载工具：彻底清除残留，轻松重装

PC端输入法双拼皮肤分享

2022年Java 工程师面试题

PhotoShop 插件开发之选区(Selection)

热门文章

在天翼云服务器部署程序不能被外网访问的问题

Android自动连接指定的wifi，免密码或指定密码

百度输入法在开始菜单中无法切换为中文输入

Transformer再下一城！DeepMind新模型自动生成CAD草图，网友：建筑设计要起飞了

FL Studio Producer Edition 21.0.3 Build 3517 中文解锁版和许可证密钥2023最新完整下载

WINDOWS系统服务详解

Chrome 驱动程序无法打开 Chrome 浏览器

必备的DevOps工具链大盘点

linux系统的u盘mmcsd卡等的支持热插拔和自动挂载行为

MathType2024官方版数学公式编辑器功能全面介绍

最新文章

华硕FL5900U笔记本电脑重装win10专业版详细操作教程

ThinkPad X1 Carbon 安装Ubuntu 18.04到移动硬盘 教程指南

重装系统相关操作流程

教你如何制作OS X Lion启动U盘与使用U盘安装系统

Win7系统下安装centos7双操作系统（U盘安装）

如何使用U盘安装操作系统,非PE安装系统的方法

用U盘安装Ubuntu15.04

不使用 U 盘等任何工具全新安装 Windows 操作系统

【重装Windows系统后】电脑环境部署

Ubuntu18双系统安装+遇到的问题+后续软件安装

ubuntu14.04 u盘安装教程

ubuntu 18.04 双系统安装

电脑安装ubuntu系统详细教程

无显示器u盘安装centos_从u盘安装centos

克隆U盘win10系统启动盘

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

《树莓派Python编程指南》——3.3　控制程序流程

CREO：CREO软件的简介、安装(七大步骤)、学习路线大全(CREO软件各模块界面解释—菜单栏&快速栏&工作区、草绘零件工程图装配设计讲解)、案例应用(几十个案例)之详细攻略

成功解决python.exe 无法找到入口无法定位程序输入点

ThinkPad X1 Carbon 安装Ubuntu 18.04到移动硬盘教程指南

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载