Scrapy 爬取京东所有图书信息

编程入门 行业动态 更新时间:2024-10-27 18:24:37

Scrapy 爬取<a href=https://www.elefans.com/category/jswz/34/1769605.html style=京东所有图书信息"/>

Scrapy 爬取京东所有图书信息

先记录代码吧,回头再写文字:

# -*- coding: utf-8 -*-
import scrapy
import json
import pprint
from copy import deepcopyclass JdSpider(scrapy.Spider):name = 'jd'allowed_domains = ['jd', 'p.3']# 这是由于后期使用有使用json解析,使用的域名为p.3start_urls = ['.html']def parse(self, response):dt_list = response.xpath('//div[@class="mc"]/dl/dt')  # 获取大分类列表for dt in dt_list:item = dict() # 创建字典,存储相关信息item['b_cate'] = dt.xpath('./a/text()').extract_first() # 大分类标题em_list = dt.xpath('./following-sibling::dd[1]/em') # 获取小分类列表位置for em in em_list:  # 小分类列表item["s_href"] = em.xpath('./a/@href').extract_first()item['s_cate'] = em.xpath('./a/text()').extract_first

更多推荐

Scrapy 爬取京东所有图书信息

本文发布于:2024-02-24 19:38:00,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1696442.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:京东   图书   信息   Scrapy

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!