爬虫01:requests模块基础"/>
Python爬虫01:requests模块基础
requests简介
采用的是Apache2 Licensed开源协议的HTTP库,基于urllib,功能强大,简单便捷,效率极高,模拟浏览器发请求。
安装
- pip安装:
pip install requests
- 通过pycharm安装:
简单使用
步骤:
- 指定url
- 发起请求
- 获取响应数据
- 持久化存储
#导入requests模块
import requests
if __name__ == '__main__':#step 1:指定urlurl = '/'#step 2:发起请求#get方法会返回一个响应对象response = requests.get(url=url)#step 3:获取响应数据page_text = response.textprint(page_text)#文本形式打印响应页面代码#step 4:持久化存储#将响应页面代码以文件形式存储with open('./sougou.html','w',encoding='utf-8') as fp:fp.write(page_text)print('爬取数据结束')
解决打印保存响应页面代码为一行的问题,可查看文章最后的Tips。
requests请求方法
requests常用请求方法包括:
更多推荐
Python爬虫01:requests模块基础
发布评论