爬虫1:python+requests+xpath抓取豆瓣电影数据1.0

编程入门 行业动态 更新时间:2024-10-12 20:21:54

<a href=https://www.elefans.com/category/jswz/34/1770264.html style=爬虫1:python+requests+xpath抓取豆瓣电影数据1.0"/>

爬虫1:python+requests+xpath抓取豆瓣电影数据1.0

前言

 1、用python来抓取豆瓣的排行电影的资源数据,主要用了requests抓取数据,xpath和正则表达式来分析数据,xlsx表格来保存数据等

当前相关脚本已优化至:

一、页面分析

1、保存表格下来的数据

2、豆瓣电影页面分析

 豆瓣电影的网址是:

 分析页面发现数据都在标签li里面,这种就需要确定需要哪些数据,再用xpath去筛选处理的

数据都在item标签里面:href、src、还要相关一些text。

二、代码分析

1.引入相应的库

结合request和BeautifulSoup的方法,xpath和正则表达式结合使用比较灵活,

re用于正则表达式的方法,lxml用于xpath树化对象,

更多推荐

爬虫1:python+requests+xpath抓取豆瓣电影数据1.0

本文发布于:2024-02-06 14:13:54,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1749311.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:爬虫   豆瓣   数据   电影   python

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!