简易网页采集器(路飞学城"/>
requests模块巩固深入案例之简易网页采集器(路飞学城
#反爬机制:UA伪装
#检测到通过浏览器载体的请求 则是一个正常的请求
import requests#UA伪装:将对应的User-Agent封装到一个字典中
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 SLBrowser/8.0.1.4031 SLBChan/103'
}url=''#处理url携带的参数:封装到字典中
kw=input('enter a word:')
param={'query':kw
}
response=requests.get(url=url,params=param,headers=headers)page_text=response.text
filename=kw+'.html'
with open(filename,'w',encoding='utf-8') as fp:fp.write(page_text)
print(filename,'保存成功!!!')
更多推荐
requests模块巩固深入案例之简易网页采集器(路飞学城
发布评论