爬虫(二)一个简单的爬虫程序与Robots协议

编程入门 行业动态 更新时间:2024-10-11 07:32:53

<a href=https://www.elefans.com/category/jswz/34/1770264.html style=爬虫(二)一个简单的爬虫程序与Robots协议"/>

爬虫(二)一个简单的爬虫程序与Robots协议

一个简单的爬虫

  • 一个简单的爬虫
    • 库的安装
    • get请求、请求头与状态码
    • BeautifulSoup
    • 爬取指定内容
  • Robots协议

一个简单的爬虫

库的安装

写程序之前,我们需要安装第三方库(使用的是Python 3.7)
这里需要安装的是requests库
操作流程:win + R - > 输入cmd -> Enter -> pip install requests,然后耐心等待

由于我已经安装好了requests库,就不再重新安装了。
测试一下:

进入Python环境,import requests,如果没有报错就说明已经完成了安装。
如果是网络问题导致的安装失败,可以去下载.whl文件进行安装。
如果安装了Pycharm,也可以通过Pycharm来安装requests库。
其他具体操作请自行搜索,不再赘述。

get请求、请求头与状态码

废话不多说,开始吧

#导入requests,如果安装成功了就不会报错
import requests
#设置请求头,这里不用打,在浏览器里复制就好了

更多推荐

爬虫(二)一个简单的爬虫程序与Robots协议

本文发布于:2024-02-25 12:37:42,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1698989.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:爬虫   协议   简单   程序   Robots

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!