python bs64爬取中国工程院院士信息

编程入门 行业动态 更新时间:2024-10-18 18:16:15

python bs64爬取<a href=https://www.elefans.com/category/jswz/34/1770066.html style=中国工程院院士信息"/>

python bs64爬取中国工程院院士信息

    作为一个渣硕已经毕业一年了,也工作一年了,得了空闲来写写文章。

     前段时间,有个老师叫我写个爬取中国工程院院士信息的爬虫,我写了个大概的代码来实现。

    先说一下做这个的整体思路吧:

                      

  开门见山的说:就是领导想要看看申请院士,从业者的经历等等信息,为了满足领导的需求,我就开始实现我的爬虫程序了

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import requests
from bs4 import BeautifulSoupdef get_content(url_string,file):ret = requests.get(url=url_string)ret.encoding = 'utf-8'soup = BeautifulSoup(ret.text, 'html.parser')content = soup.find_all(name='li',class_='name_list')for list_content in content:main_http=''for i in list_content:cotent_url=main_http+i['href']  #拼接URL 获取每个URL下院士的信息cotent_detail = r

更多推荐

python bs64爬取中国工程院院士信息

本文发布于:2024-02-12 05:28:42,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1686308.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:中国   工程院院士   信息   python

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!