python爬虫入门表_Python爬虫入门|电子爱好者

admin管理员组
文章数量:1574537

还没有写完...待续...看不懂的可以等我视频出来~

视频链接：http://www.bilibili/video/av11253964/

参考大佬的博客：博客是Python社区的一位大佬写的，博客园死活不让我放链接，说违禁...不知道怎么回事，呵呵了....我偏要放，就算是图片，是吧大佬...

HTTP的两种方法(一种是GET一种是POST)：http://www.w3school/tags/html_ref_httpmethods.asp

最简单的一个爬虫代码：

#!/usr/bin/python

#coding:utf-8importurllib2

response= urllib2.urlopen('http://www.baidu/')

html=response.read()print html

看看上面的代码，陌生吗？反正很少是吧？我来教你，很简单的

现在我们来加一个Request，来看看代码怎么样了

#!/usr/bin/python#coding:utf-8

importurllib2

req= urllib2.Request('http://wwwblogs/yunquan/')

response=urllib2.urlopen(req)

the_page=response.read()print the_page

现在加了request之后，结果是一模一样的，那为什么还要加request这个东西呢？是因为request这东西可以传递两个参数

1.发送Data数据表单

2.作为HTTP的headers来额外的发送数据或本身的信息

那我们就来看看这两种情况

一、发送Data数据表单

#!/usr/bin/python#coding:utf-8

importurllibimporturllib2

url= 'http://www.baidu'values= {'name' : 'Michael Foord','location' : 'pythontab','language' : 'Python'}

data=urllib.urlencode(values)

req=urllib2.Request(url, data)

response=urllib2.urlopen(req)

the_page= response.read()

这里面的values也不知道是个啥格式，反正就是有值，然后我们把values给编码了....用的urlencode...因为浏览器只认识编码那种非人类的东西，所以我们得投其所好...

然后，当当当当！我们下面的request是不是多了一个参数？对，就是被编码后的values...再向下就是套路了，一个open,一个read....全是套路....

然后柘林还有一个HTTP发送请求的两种格式，参考：http://www.w3school/tags/html_ref_httpmethods.asp

importurllib2importurllib

data={}

data['name'] = 'Somebody Here'data['location'] = 'pythontab'data['language'] = 'Python'url_values=urllib.urlencode(data)

url= 'http://www.baidu'full_url= url + '?' +url_values

data= urllib2.open(full_url)

二、作为HTTP的headers来额外的发送数据或本身的信息

importurllibimporturllib2

url= 'http://www.baidu'user_agent= 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'values= {'name' : 'Michael Foord','location' : 'shuyuqnuan','language' : 'Python'}

headers= { 'User-Agent': user_agent }

data=urllib.urlencode(values)

req=urllib2.Request(url, data, headers)

response=urllib2.urlopen(req)

the_page= response.read()

安装beautifulsoup

#Mac下安装

sudo easy_install beautifulsoup4

#Ubantu下安装

pip install beautifulsoup4

我们来写一个爬图片的爬虫(文件夹自己建，link那里看情况写)

#!/usr/bin/python#coding:utf-8

importurllibimporturllib2importosfrom bs4 importBeautifulSoupdefgetAllImageLink():

html= urllib2.urlopen('http://ac.qq/').read()

soup= BeautifulSoup(html,'html.parser')

liResult= soup.findAll('img')

count=0;for image inliResult:

count+= 1link= ‘看情况’+image.get('src') #这里看情况，src和url一样了就不写，不一样的话就加上前缀，直到link等于url为止

imageName=count

filesavepath= '/Users/net/Desktop/testpython/%s.jpg' %imageNameprintfilesavepath

urllib.urlretrieve(link,filesavepath)printfilesavepathif __name__ == '__main__':

getAllImageLink()

本文标签：爬虫入门 Python

版权声明：本文标题：python爬虫入门表_Python爬虫入门内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1727773936a1128888.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

python爬虫抓取分页论文_关于爬虫分页问题 - 自我总结

10小时前

最近跟着老师学习，写了几个爬虫。写爬虫不可能只爬取一个页面，往往涉及到分页爬取。本文对自己在写爬虫的过程中关于分页爬取做一次小小的总结。一、静态加载如糗事百科，美股吧。这种网页url一般都带有页码信息，翻页的时候url会发生变化，页面内

Python爬虫之JS逆向分析技巧

9小时前

Python爬虫之JS逆向分析技巧当我们使用爬虫时，遇到被JS加密的参数怎么办？ 有人会说用Selenium不就可以了么，但是Selenium执行又没效率怎么办&#

我们应该怎么正确看待HTTP协议以及CDN和爬虫充当的角色

9小时前

一、HTTP是什么：超文本传输协议(HyperText Transfer Protocol) 协议：首先，HTTP是一个协议，而协议是交流沟通双方保证

python中接入支付宝当面付

9小时前

准备由于正式环境需要商户信息，所以这里使用支付宝提供的沙箱环境。切换到正式环境后只需稍改配置。 1、点击进入蚂蚁金服平台官网。 2、如下图选择：开发者中心->开发服务下的研发服务->

python操作CAD转存dwg文件

4小时前

#准备工作import sysimport win32com.clientimport mathimport time, osfrom datetime import datetimefrom write_xls import

使用Python实现自动刷题 P2

2小时前

使用Python实现自动刷题 P2 只做学习交流,不做任何商业用途不同于P1的漏洞,这次是题库爬到本地进行匹配没有第一篇详细，主要讲讲思路传送门集刷题和补全题库为一体源码: github: http

Python超市管理系统毕业设计-附源码111042

2小时前

目录摘要 1 1 绪论 1 1.1研究背景 1 1.2研究现状 1 1.3系统开发技术的特色 1 1.4论文结构与章节安排 1 2 基于Python的超市管理系统系统分析 3 2.1 可行性分析 3 2.2 系统流程分析 3 2.2

基于Python的学生会学工工资管理-附源码111449

2小时前

目录摘要1 绪论1.1研究意义1.2研究现状1.3系统开发技术的特色1.4论文结构与章节安排2 基于Python的学生会学工工资管理系统分析2.1 可行性分析2.2 系统流程分析2.2.1数据增加流

Node.js-社区干洗店服务微信小程序-79573（免费领源码+开发文档）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案

2小时前

目录摘要1 绪论1.1意义1.2课题背景1.3node.js主要功能1.4node.js功能模块1.5论文结构与章节安排2社区干洗店服务微信小程序系统分析2.1 可行性分析2.2 系统流程分析2

（附源码）Python超市管理系统毕业设计111042

2小时前

基于python的家政管理系统毕业设计源码071111

2小时前

目录摘要1 绪论1.1开发意义1.2研究现状1.3系统开发技术的特色1.4论文结构与章节安排2 基于Python的家政管理系统系统分析2.1 可行性分析2.2 系统流程分析2.2.1数据增加流程

Python破解WIFI的简单代码

48分钟前

大家好，今天要讲的是关于破解wifi密码的小程序，当然和往常一样，为了让程序更加易于使用，我们将使用GUI（tkiner）来做一个交互界面,对于破解而言，程序大部分只能做简单的撞库破解，自己去找一个密码本，一个个试，用大量时间和精力破解密

渗透之——Python爆破Wifi密码

46分钟前

转载请注明出处：https:blog.csdnl1028386804articledetails86257581 脚本以图形界面的形式，选择爆破的用户名字典文件和密码字典文件进行Wi

python 破解WiFi

41分钟前

原理： 1.获取WiFi网卡 2.扫描WiFi列表 3.根据密码本尝试连接WiFi 代码： import pywifiimport timefrom pywifi import co

用Python解析WIFI密码

40分钟前

用Python解析WIFI密码生成密码本主要功能生成密码本 # 生成一个六位数的密码本import itertools as its#引入迭代器的模块words_num"1234567890"words

用 Python 给全球女神颜值排个序

29分钟前

点击上方“码农突围”，马上关注，每天上午8:50准时推送这里是码农充电第一站，回复“666”，获取一份专属大礼包真爱，请设置“

用 Python 破解老王家的 Wi-Fi 密码，刺激！

25分钟前

家里没有怎么办，只要你会Python，办法总比困难多本文就利用pywifi 这个库实验一下如何破解Wi-Fi 密码，注意，该方法仅可用来研究学习所用

Python渗透测试编程技术——身份认证攻击

18分钟前

一、简单网络服务认证的攻击四分之三原则：数字大写字母小写字母特殊的字符不要少于8为更换密码的频次不要小于3个月针对这些简单的网络服务认证，可以采用一种“暴力破解”的方法。这种方法的思路很简单，就是把所有可能的密码都尝试一遍

python渗透工具编写学习笔记：8、无线网络渗透

9分钟前

目录前言 8.1 概念 8.2 无线网络发现 8.3 无线网络弱点分析 8.3.1 使用Scapy来探测无线网络 8.3.2 使用Aircrack-ng工具 8.4 无线网络密码破解 8.5无线网络漏洞利用&#xff

2019 年最受欢迎的 Python 开源项目盘点！

1分钟前

点击上方“Python技术之巅”，马上关注，每天下午17:40准时推送真爱，请置顶或星标 Python是当下最火的编程语言之一，在GitHub上有大量

电子爱好者 - 最新技术资讯及电子产品介绍！

python爬虫入门表_Python爬虫入门

更多相关文章

python爬虫抓取分页论文_关于爬虫分页问题 - 自我总结

Python爬虫之JS逆向分析技巧

我们应该怎么正确看待HTTP协议以及CDN和爬虫充当的角色

python中接入支付宝当面付

python操作CAD转存dwg文件

使用Python实现自动刷题 P2

Python超市管理系统 毕业设计-附源码111042

基于Python的学生会学工工资管理-附源码111449

Node.js-社区干洗店服务微信小程序-79573（免费领源码+开发文档）可做计算机毕业设计JAVA、PHP、爬虫、APP、小程序、C#、C++、python、数据可视化、大数据、全套文案

（附源码）Python超市管理系统 毕业设计111042

基于python的家政管理系统毕业设计源码071111

Python破解WIFI的简单代码

渗透之——Python爆破Wifi密码

python 破解WiFi

用Python解析WIFI密码

用 Python 给全球女神颜值排个序

用 Python 破解老王家的 Wi-Fi 密码，刺激！

Python渗透测试编程技术——身份认证攻击

python渗透工具编写学习笔记：8、无线网络渗透

2019 年最受欢迎的 Python 开源项目盘点！

发表评论

推荐文章

php无法访问_关于php无法用localhost访问的

让程序无法连外网，但可以连内网

计算机基础知识在哪里学,学习电脑基础知识先从哪方面入手?

神器啊！轻松用 Python 写个 APP！

Mac必备老牌开源下载工具 Free Download Manager 中文版

热门文章

电脑文字出现重影、屏幕模糊。

【Qt】获取屏幕的放大系数

Win10下Chrome浏览器无法安装 Adobe Flash Player 如何解决

登录微软账号的Windows电脑如何远程？

PyQt5基础知识大全

计算机组装工具以及装机流程,如何组装电脑，图文教程详解电脑组装全过程

【超丝滑的LangChain教程】LangChain进阶之Agents

2011热门论坛排行top100

java dwg文件_Object java添加dwg文件问题

kali-crunch构造字典

最新文章

Bugku Misc 想蹭网先解开密码

2019 年最受欢迎的 Python 开源项目盘点！

原创|推荐一款密码管理神器

WiFi流量劫持—— 截获支付宝账号

五十三 wifi配置工具

为什么 VS Code 会这么牛逼？

警惕：程序员现场演示：揭秘http劫持本质，在也不敢使用免费wifi

关于破解电信光猫实现内网穿透（端口转发，端口映射）

华为AP5030DN-S 瘦固件转胖固件

wifite+hashcat

学习笔记-Hashcat

Hack The Box-WifineticTwo

用c++写的PlayFair密码的加密与解密算法

kali-crunch构造字典

太可怕了！有些码农为啥写代码，写到监狱里去了？

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

Python超市管理系统毕业设计-附源码111042

（附源码）Python超市管理系统毕业设计111042

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载