用Scrapy抓取英雄联盟所有皮肤|电子爱好者

admin管理员组
文章数量:1619746

部署scrapy

在命令行中输入：

scrapy startproject lolskinSpider
cd lolskinSpider
scrapy gensipder lolskin lol.qq

然后进入文件夹开始构造任务

设置scrapy

首先要分析爬取的网站，观察英雄联盟官网英雄联盟游戏资料，利用scrapy shell

scrapy shell "https://lol.qq/data/info-heros.shtml"

hero=response.xpath('//*[@]/li[1]/a/@title')
hero

发现结果为空值，因此该网站可能采用xhr异步渲染，再次刷新网站，我们发现：

在preview中，我们得知将需要hero下的heroId来跳转到对应的英雄界面，在英雄界面中，我们需要skins下的皮肤名称name和皮肤下载链接mainImg

设置items.py

打开items.py，我们需要爬取两类数据，一是皮肤名称，二是皮肤下载链接，所以：

import scrapy

class LolskinspiderItem(scrapy.Item):
    #图片名称
    name=scrapy.Field()
    #图片下载地址
    img_url=scrapy.Field()

设置lolskin.py

这是我们的主要文件，从js文件的request.url中得知我们将要爬取的网址，因此在这里allowed_domain将不再需要。分析可得，每一个英雄的网址的区别就是最后的数字，数字对应每一个英雄的ID。

import scrapy
from json import loads
from ..items import LolskinspiderItem

class LolskinSpider(scrapy

本文标签：皮肤英雄联盟 scrapy

版权声明：本文标题：用Scrapy抓取英雄联盟所有皮肤内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1728793874a1173980.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

用Scrapy抓取英雄联盟所有皮肤

部署scrapy

设置scrapy

设置items.py

设置lolskin.py

更多相关文章

英雄联盟游戏文件tcj.dll已损坏怎么办？英雄联盟游戏文件tcj.dll已损坏原因分析以及解决方法分享

打造最全皮肤，Python采集英雄联盟（LOL）官网数据！

用户首次登录之前必须更改密码_英雄联盟手游新手须知游玩英雄联盟手游前你必须知道的...

nodejs+puppeteer+chromium爬取异步数据页面（英雄联盟英雄资料列表页+详情页）

ID CS6怎么加框_英雄联盟手游怎么修改游戏id-lol手游改中文名方法分享

现在如何注册台服服务器,《英雄联盟手游》台服账号注册教程 台服拳头账号注册步骤图解...

Web前端大作业——简单的学生网页作业源码 基于html css javascript仿英雄联盟LOL游戏网站

【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片（附源码）_游戏数据抓取

英雄联盟提示tersafe.dll已损坏怎么办？英雄联盟提示tersafe.dll已损坏快速修复方法介绍

牛散村:python怎么爬取英雄联盟皮肤图片？爬虫实战！

【Python探讨】PyQt5、request模块联合编写的英雄联盟全皮肤下载器| 附源代码

kf.qq.lol.html,英雄联盟手游预约FAQ

【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片（附源码）

如何运用python爬游戏皮肤_实用Python是如何爬取英雄联盟（lol）全部皮肤，涨知识了...

利用matlab爬虫从OPGG上整理LOL英雄信息

[附源码]计算机毕业设计Python+uniapp英雄联盟网站APPr40r9(程序+lw+APP+远程部署)

现在如何注册台服服务器,《英雄联盟手游》台服怎么注册账号 台服注册账号方法...

云顶之弈服务器维护多长时间,英雄联盟3.17更新维护时间介绍 云顶之弈什么时候可以玩_18183云顶之弈专区...

无法往开启kerberos的zookeeper上注册服务_英雄联盟手游拳头账号有几个区？lol手游韩国账号怎么注册？...

python爬取千图网_python爬取lol官网英雄图片代码

发表评论

推荐文章

SBR-CH14 道德和关联方

一些实用的电脑小技巧

window10华硕计算机主板VT,华硕主板怎么开启vt【设置步骤】

联想Y7000的屏幕亮度不能调节

打印时总跟出一页计算机主的纸,打印机只打印一页却重复不停打印的原因之一和解决方法...

热门文章

计算机死机的解决方法及操作步骤,电脑关机时死机怎么办【图文教程】

Mac浏览器打不开百度网页

让你效率爆表的网页设计PHOTOSHOP插件包

2021-6-27：开发小而美的博客（前端首页展示）

selenium 反爬虫之跳过淘宝滑块验证！首先要搞定JS！

Hi3519A 开发板重装系统（烧写uboot、kernel、fs) + 重新加载驱动

解决mvn常用指令build failure的问题

【ubuntu】【python】Temporary failure resolving ‘security.ubuntu.com‘

The Innovation | Volume 3 Issue 3 Live Now

迅雷下载到99.99%速度0kbs怎么办？

最新文章

超详细VMware安装Ubuntu虚拟机步骤

ROS下载、安装与配置

ps无法启动 计算机缺失,运行Photoshop提示没法启动此程序,因为计算机中丢失MSVCP110.dll...

【实用工具】Gephi下载与安装

Node.js安装与配置（详细步骤）

2021你还在苦苦寻找的Ps磨皮插件在这！PS实用插件分享

SecureCRT 8.5下载安装破解

RabbitMQ下载安装---最新版本--亲测可用

软件安装管家软件目录备份

Multisim 14.3 安装教程

LaTex下载与安装教程（一切为了学术~）

surface&amp;pro系列买到手第一件事——基础配置及基本软件安装指南【伸手党福利】

ubuntu下进行软件中心安装

ubuntu16.04系统安装及相关软件安装及配置

Foxmail软件的安装和使用

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

现在如何注册台服服务器,《英雄联盟手游》台服账号注册教程台服拳头账号注册步骤图解...

Web前端大作业——简单的学生网页作业源码基于html css javascript仿英雄联盟LOL游戏网站

现在如何注册台服服务器,《英雄联盟手游》台服怎么注册账号台服注册账号方法...

云顶之弈服务器维护多长时间,英雄联盟3.17更新维护时间介绍云顶之弈什么时候可以玩_18183云顶之弈专区...

ps无法启动计算机缺失,运行Photoshop提示没法启动此程序,因为计算机中丢失MSVCP110.dll...

surface&pro系列买到手第一件事——基础配置及基本软件安装指南【伸手党福利】

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载