爬虫爬取京东某类书籍图片并保存到本地

编程入门 行业动态 更新时间:2024-10-28 12:25:51

<a href=https://www.elefans.com/category/jswz/34/1770264.html style=爬虫爬取京东某类书籍图片并保存到本地"/>

爬虫爬取京东某类书籍图片并保存到本地

python爬虫爬取京东某类书籍图片并保存到本地
完整代码

#!/usr/bin/env python3
# -*- coding: utf-8 -*-import re
import urllib.request
import urllib.error
import urllib.parsesum = 0
def craw(url,page):req=urllib.request.Request(url)req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36')html1 = urllib.request.urlopen(req).read()html1=str(html1)pat1 = '<div id="J_goodsList".+?<span class="clr"></span>'result1=repile(pat1).findall(html1)result1=result1[0]pat2 = '<img width="" height="" data-img="1" src="//(.+?[\.jpg|\.png])"'imagelist=repile(pat2).findall(result1)x=1global sumfor imageurl in imagelist:imagename='E:/pythonProjects/paChong/jdBook/'+str(page)+'-'+str(x)+'.jpg'imageurl="http://"+imageurltry:urllib.request.urlretrieve(imageurl,filename=imagename)except urllib.error.URLError as e:if hasattr(e,'code') or hasattr(e,'reason'):x+=1print('成功爬取第%d页第%d张图片'%(page,x))x+=1sum+=1for i in range(1,20):url='.html?cat=1713,3287,3805&page='+str(i)craw(url,i)
print('爬取结束,总共保存了%d张图'%sum)

更多推荐

爬虫爬取京东某类书籍图片并保存到本地

本文发布于:2024-03-09 01:27:06,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1723226.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:爬虫   并保存   京东   书籍   某类

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!