scrapy项目创建

编程入门 行业动态 更新时间:2024-10-13 22:22:25

scrapy<a href=https://www.elefans.com/category/jswz/34/1771421.html style=项目创建"/>

scrapy项目创建

scrapy模块

  • 安装
  • 创建项目
  • 使用项目
    • 安装
    • 原理
  • 启动
  • 爬取
    • 修改dingdian.py的start_urls和print(response.text)。
    • 修改settings.py的一些参数
    • 了解middlewares.py中间件
    • 爬取
    • scrapy选择器
    • 管道
    • 下载器中间件
    • cookie
    • 多个项目

安装

使用cmd控制台查看scrapy是否安装,没有就安装完再查看。

>conda list
>conda install scrapy
>conda list

创建项目

使用window powershell控制台,先跳转到pycharm项目地址,然后创建项目hello。
创建完成后进入hello目录确定项目主题为dingdian,完成项目创建。

>cd d:
>cd D:\py-workplace
>scrapy startproject hello
>cd hello
>scrapy genspider dingdian wwwwww

打开pycharm,看到项目hello打开。

使用项目

安装

在pycharm的控制台也需要安装scrapy

>pip install scrapy

会有安装提示

Installing collected packages: zope.interface, w3lib, twisted-iocpsupport,
pyasn1, lxml, incremental, hyperlink, hyperframe, hpack, cssselect, 
constantly, Automat, Twisted, pyasn1-modules, priority, parsel, jmespath,
itemadapter, h2, service-identity, queuelib, PyDispatcher, protego,
itemloaders, scrapy

原理

爬虫文件在如图dingdian.py文件书写,items.py用于临时存储,middlewares.py中间件,pipelines.py下载管道,settings.py配置文件。

取自

更多推荐

scrapy项目创建

本文发布于:2024-02-10 18:46:02,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1676755.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:项目   scrapy

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!