爬取实例三：爬取lol英雄联盟全阵容皮肤和爬王者荣耀全阵容皮肤|电子爱好者

admin管理员组
文章数量:1619275

1、结果展示

将每一个英雄保存一个文件夹下，把他所有的皮肤保存在他对应的文件夹下(自动生成的你运行爬虫就好了)

2、代码解释

2.1用到第三方的模块

有些自带，有些需要你自己安装，pip install 模块名就好了，如果有问题可以看我的第三方库导入大全那篇文章，有详细解释

import requests # 请求数据
import os # 操作系统模块，用于创建文件夹
import jsonpath # 用于提取json类型的数据
import re # 正则表达式模块，用于获取皮肤名称
import time # 时间模块，防止爬的太快被封id
import random # 随机数模块，配合time使用

2.2请求头以及主页面js地址

user-agent：故名思意，用户代理，你设置了这个相当于把爬虫程序伪装成浏览器，如果不设置，服务器就会发现你是爬虫，这是最基本的反爬手段之一
hero_list_url：这是通过分析lol官网页面从中提取hero_id的url，如果想学页面分析可以留言我在写一篇分析页面的文章，这个主要教如何爬取

headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.106 Safari/537.36'
           }
hero_list_url = 'https://game.gtimg/images/lol/act/img/js/heroList/hero_list.js'

2.3获得详情页面的函数

写一个获得hero_id的函数找到每一个英雄的详情url为下载做准备，这里我用了列表推导式作为返回值将所有英雄的详情url返回出来方便下载函数调用

def get_id(url):
    response = requests.get(url, headers=headers).json()
    hero_Id = jsonpath.jsonpath(response, '$..heroId')
    time.sleep(random.randint(1, 3))
    base_url = 'http://game.gtimg/images/lol/act/img/js/hero/{}.js'
    return [base_url.format(every_id) for every_id in hero_Id]

2.4定义函数一个提取及下载数据

我直接再代码中进行解释

def get_skin(li1):
      for url in li1: # 遍历列表推导式
        response = requests.get(url, headers=headers)
        result = response.json()['skins'] # 得到关于皮肤的所有信息
        skin_name = [] # 设置空列表用来存储提取到的皮肤名
        skin_url = [] # 设置空列表用来存储提取到的皮肤下载地址
        time.sleep(random.randint(1, 3)) # 随机休眠1到3秒防止被封
        for skin_json in result:
            skin_name.append(skin_json['name']) # 将英雄名保存到上面的空列表之中
            skin_url.append(skin_json['mainImg']) # 将英雄下载地址保存到上面的空列表之中
        hero_folder = 'allhero/' + response.json()['hero']['name'] + response.json()['hero']['title']
        #设置保存的路径
        if not os.path.exists(hero_folder):
            os.mkdir(hero_folder)
        # 判断路径是否存在不存在就创建一个
        for i in range(len(skin_url)):
            if not skin_url[i]=='':
                image_path = hero_folder +'/' + re.findall('\w+',skin_name[i])[0] + '.png' # 具体设置图片的下载路径以及名称和格式
                with open(image_path,'wb')as file:
                    print('正在下载{}'.format(skin_name[i])) # 打印下载进度
                    file.write(requests.get(skin_url[i],headers=headers).content) #下载图片

3、完整代码

如果遇到问题可以留言，我看到了就会解答，喜欢的话可以关注我呀，我基本每天都会更新有趣的东西

import requests
import os
import jsonpath
import re
import time
import random

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.106 Safari/537.36'
}


def get_id(url):
    response = requests.get(url, headers=headers).json()
    hero_Id = jsonpath.jsonpath(response, '$..heroId')
    time.sleep(random.randint(1, 3))
    base_url = 'http://game.gtimg/images/lol/act/img/js/hero/{}.js'
    return [base_url.format(every_id) for every_id in hero_Id]


def get_skin(li1):
    for url in li1:
        response = requests.get(url, headers=headers)
        result = response.json()['skins']
        skin_name = []
        skin_url = []
        time.sleep(random.randint(1, 3))
        for skin_json in result:
            skin_name.append(skin_json['name'])
            skin_url.append(skin_json['mainImg'])
        hero_folder = 'allhero/' + response.json()['hero']['name'] + response.json()['hero']['title']
        if not os.path.exists(hero_folder):
            os.mkdir(hero_folder)
        for i in range(len(skin_url)):
            if not skin_url[i] == '':
                image_path = hero_folder + '/' + re.findall('\w+', skin_name[i])[0] + '.png'
                with open(image_path, 'wb')as file:
                    print('正在下载{}'.format(skin_name[i]))
                    file.write(requests.get(skin_url[i], headers=headers).content)


if __name__ == '__main__':
    hero_list_url = 'https://game.gtimg/images/lol/act/img/js/heroList/hero_list.js'
    li1 = get_id(hero_list_url)
    get_skin(li1)

4、王者荣耀

会遇到英雄名乱码，以及皮肤名乱码等问题，通过selenium获得网页解决，爬取思路很简单，附上结果截图以及源码，为啥我写的博客这么少人看呢

# url = 'https://game.gtimg/images/yxzj/img201606/skin/hero-info/150/150-bigskin-6.jpg'
# url = 'https://game.gtimg/images/yxzj/img201606/heroimg/167/167-smallskin-8.jpg'
# url = 'https:game.gtimg/images/yxzj/img201606/skin/hero-info/167/167-bigskin-8.jpg'
# url = 'https:game.gtimg/images/yxzj/img201606/skin/hero-info/506/506-bigskin-2.jpg'
# https://pvp.qq/web201605/herodetail/167.shtml
# 获得英雄名称以及英雄id
import requests,re,os,random,time
from lxml import etree
from selenium import webdriver

option = webdriver.ChromeOptions()
option.add_argument('headless')
driver = webdriver.Chrome(options=option)

list = ['Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.163 Safari/535.1',
        'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36',
        'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11',
        'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:6.0) Gecko/20100101 Firefox/6.0',
        'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:2.0.1) Gecko/20100101 Firefox/4.0.1',
        'Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50',
        'Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko',
        'Mozilla/5.0 (Macintosh; Intel Mac OS X 11_0_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.67 Safari/537.36']
user_agent = random.choice(list)

header = {
    'User-Agent': user_agent,
    'Referer': 'https://pvp.qq/web201605/herolist.shtml'
}

driver.get('https://pvp.qq/web201605/herolist.shtml')
res = driver.page_source

dom1 = etree.HTML(res)
every_id = dom1.xpath('//ul[@class="herolist clearfix"]/li/a/@href')
every_name = dom1.xpath('//ul[@class="herolist clearfix"]/li/a//@alt')
for init_id,name in zip(every_id,every_name):
    id = re.findall('herodetail/(.*?).shtml',init_id)[0]
    detail_url = f'https://pvp.qq/web201605/herodetail/{id}.shtml'
    driver.get(detail_url)
    result2 = driver.page_source
    dom2 = etree.HTML(result2)
    skin_name = dom2.xpath('//div[@class="pic-pf"]/ul/@data-imgname')[0]
    ervery_skin = skin_name.split('|')
    hero_folder = os.getcwd() + '/王者荣耀/' + name
    if not os.path.exists(hero_folder):
        os.mkdir(hero_folder)
    for i,skin_na in enumerate(ervery_skin):
        # pic_link = 'https:game.gtimg/images/yxzj/img201606/skin/hero-info/506/506-bigskin-2.jpg'
        pic_link = f'https://game.gtimg/images/yxzj/img201606/skin/hero-info/{id}/{id}-bigskin-{i+1}.jpg'
        image_path = hero_folder + '/' + skin_na + '.jpg'
        with open(image_path, 'wb')as file:
            print('正在下载%s 之 %s' % (name, skin_na))
            file.write(requests.get(pic_link, headers=header).content)

本文标签：阵容皮肤王者实例英雄

版权声明：本文标题：爬取实例三：爬取lol英雄联盟全阵容皮肤和爬王者荣耀全阵容皮肤内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1728795506a1174126.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

千图成像python_爬取英雄联盟所有皮肤图片实现千图成像～

3小时前

:点击上方[Python爬虫数据分析挖掘]→右上角[...]→[设为星标⭐] 前文本文主要分为两个部分一部分是爬虫，这边是选择爬取英雄联盟官网英雄资料中的英雄皮肤图片，如下为新英雄seraph

用Python爬取英雄联盟所有皮肤~隔壁小孩羡慕的哭了

3小时前

导语昨天下边回家在电梯口遇到一小屁孩哭着吵着要他麻麻给买一LOL皮肤看到他妈妈青一块白一块的脸色我已经心里在给这小孩默哀了结果就是撒泼打滚皮肤也没搞到手但是领到了麻麻赏赐的大嘴巴子于是小编就有想法出这期了~感兴趣的铁汁萌往下滑&am

lol八月那服务器有无限火力,英雄联盟无限火力8月开启时间 2021年8月无限火力时间...

3小时前

导读现在已经是7月末了，英雄联盟官方在这个月推出了比较法，比如推出了全新玩法终极宝典，体验这个新模式，玩家可以将召唤师技能替换成其他英雄技能&

如何做一个英雄联盟中的亮牌子功能

3小时前

功能效果展示运行环境 Win7，Win8，Win10 Reworld版本体验版 vc_redist.x64 运行环境针对零基础读者的补充下载安装 Reworld对应版本 Rewo

千图成像python_爬取英雄联盟所有皮肤图片实现千图成像！Python真强！！

3小时前

前文本文主要分为两个部分一部分是爬虫，这边是选择爬取英雄联盟官网英雄资料中的英雄皮肤图片，如下为新英雄seraphine的页面，包含英雄对应的所有皮肤&#xff1

python爬取英雄联盟所有皮肤价格表_利用Python协程来爬取LOL所有英雄的皮肤高清图片...

3小时前

最近有一朋友要LOL的数据进行数据分析，叫我帮他抓一下数据。突发奇想，顺便把英雄的所有皮肤下载到本地好了。 PS： 安装了LOL的伙伴图片直接在LOL文件夹里面&#x

LPL比赛数据可视化，完成这个项目，用尽了我的所有Python知识_lol英雄信息爬虫数据可视化

3小时前

代码过多，请到源码中查看 Echarts部分小总结 Echarts部分不是很难，直接到Echarts官网实例中找你想要的图表，然后复制代码，修改图表的

tgp助手服务器连接失败,用TGP助手安装英雄联盟失败

3小时前

安装TGP游戏平台出现error launching installer怎么解决？ 操作系统求大神来啊急！！！！&#x

LOL弗雷尔卓德服务器维护,英雄联盟4月28日维护到几点部分大区模式维护公告...

3小时前

英雄联盟4月28日维护到几点?英雄联盟维护内容是什么?英雄联盟今天维护到什么时候?想必有不少的小伙伴们都想知道吧，下面是英雄联盟部分大区模式维护公告，感兴趣的小伙伴们一起来看看吧。英雄联盟4月2

python爬虫--实战英雄联盟LOL壁纸下载

3小时前

爬取的是国服的官网，所以图片并没有所谓的4K之类的， 尺寸可选择的也不多，所以我就下载了个人比较喜欢的两种尺寸。 import osfrom urllib import

【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片（附源码）

3小时前

🚀用Java爬一下英雄联盟数据 📓推荐网站(不断完善中)：个人博客 📌个人主页：个人主页 👉相关专栏

英雄联盟是什么？

3小时前

我是一名大二的女学生，一直以来我对游戏方面都缺乏一定的了解，在一次偶然的机会，有幸去观看了一场S11全球总决赛，刚开始看得一头雾水&#xff0c

如何看自己在英雄联盟中的定位？也就是自己的本命英雄？

3小时前

对于这个问题，大多数的玩家都会去官网查看，因为那里已经给大多数玩家生成好了。但是你们发现没有，一般自己心目中所想或者比较喜欢的都不是自己的本命英雄，难道

PHP LOL接口,电竞英雄联盟数据API接口 - 【赛事列表】API调用示例代码

3小时前

野子电竞数据官网改版https:www.xxe.io全新登场 import com.alibaba.fastjson.JSON; import com.alibaba.fastjson.annotation.JSONField; im

现在如何注册台服服务器,《英雄联盟手游》台服怎么注册账号台服注册账号方法...

3小时前

12月10日，也就是今天，英雄联盟手游不仅更新了新内容，还开放了包括台服在内的一大批服务器，虽然这次依旧没有国服，但是大家可以进入

【91xcz英雄联盟虚空行者卡萨丁xp主题91xcz】

3小时前

英雄联盟虚空行者卡萨丁xp主题ghost xp系统下载之家主题大小：8.07 MB 主题分类： XP主题主题简介：英雄联盟虚空行者卡萨丁xp桌面是由主题之家&

Requests库应用实例4：网络图片的爬取与存储(以爬取英雄联盟皮肤图片为例)

3小时前

网络图片的爬取与存储 1.获取爬取图片的URL2.代码3.批量下载lol皮肤图片完整代码 1.获取爬取图片的URL 以艾希的源计划联合为例这个图片的URL：https:game.gtimgimageslo

云顶之弈服务器维护多长时间,英雄联盟3.17更新维护时间介绍云顶之弈什么时候可以玩_18183云顶之弈专区...

3小时前

英雄联盟更新结束可以玩了吗?大家知道，今天凌晨，英雄联盟官方发布了维护公告，说是从凌晨2点到中午12点维护，然后大家进不了排位赛，

3dmip12小时内无法注册_iPhone12如何玩英雄联盟手游？一分钟教你快速注册下载台服lol手游_3DM手游...

3小时前

之前iPhone12发布会上，官方展示用iPhone12玩英雄联盟手游的画面，相信让许多人记忆犹新。IP新机加上英雄联盟手游的组合，看得许多果粉玩家都想赶紧拿新机玩游戏。而最

超能英雄第一至四季全集Heroes迅雷下载

24分钟前

本季第一、二、三、四季 Heroes Season (2006-2009) 看点：《Heroes》是NBC电视台于2006年九月开播的最新科幻电视剧。Heroes（中文剧名为“英雄”或“天骄”&a

电子爱好者 - 最新技术资讯及电子产品介绍！

爬取实例三：爬取lol英雄联盟全阵容皮肤和爬王者荣耀全阵容皮肤

1、结果展示

2、代码解释

2.1用到第三方的模块

2.2请求头以及主页面js地址

2.3获得详情页面的函数

2.4定义函数一个提取及下载数据

3、完整代码

4、王者荣耀

更多相关文章

千图成像python_爬取英雄联盟所有皮肤图片实现千图成像～

用Python爬取英雄联盟所有皮肤~隔壁小孩羡慕的哭了

lol八月那服务器有无限火力,英雄联盟无限火力8月开启时间 2021年8月无限火力时间...

如何做一个英雄联盟中的亮牌子功能

千图成像python_爬取英雄联盟所有皮肤图片实现千图成像！Python真强！！

python爬取英雄联盟所有皮肤价格表_利用Python协程来爬取LOL所有英雄的皮肤高清图片...

LPL比赛数据可视化，完成这个项目，用尽了我的所有Python知识_lol英雄信息爬虫数据可视化

tgp助手服务器连接失败,用TGP助手安装英雄联盟失败

LOL弗雷尔卓德服务器维护,英雄联盟4月28日维护到几点 部分大区模式维护公告...

python爬虫--实战英雄联盟LOL壁纸下载

【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片（附源码）

英雄联盟是什么？

如何看自己在英雄联盟中的定位？也就是自己的本命英雄？

PHP LOL接口,电竞英雄联盟数据API接口 - 【赛事列表】API调用示例代码

现在如何注册台服服务器,《英雄联盟手游》台服怎么注册账号 台服注册账号方法...

【91xcz*英雄联盟虚空行者卡萨丁xp主题*91xcz】

Requests库应用实例4：网络图片的爬取与存储(以爬取英雄联盟皮肤图片为例)

云顶之弈服务器维护多长时间,英雄联盟3.17更新维护时间介绍 云顶之弈什么时候可以玩_18183云顶之弈专区...

3dmip12小时内无法注册_iPhone12如何玩英雄联盟手游？一分钟教你快速注册下载台服lol手游_3DM手游...

超能英雄第一至四季全集Heroes迅雷下载

发表评论

推荐文章

ubuntu18.04打开markdown文件remarkable

FINA1310: Corporate Finance Spring 2024SQL

百度和谷歌浏览器,bing界面有背景图片

记录一下在浏览器端利用微信地图定位接口和百度地图定位接口实现高精度定位的开发心得

网络通信详细过程（通过浏览器访问百度）

热门文章

苹果邮箱（@icloud.com）：双重验证+专用密码登录

用U盘安装Linux时U盘启动没有指定路径的解决方法

Android配置Scheme使用浏览器唤起APP的方式，以及不生效问题解决

python selenium 打开浏览器自动闪退

[Git] 配置Access Token 解决Github 认证弹窗

常见的个人电脑入侵方式

计算机组装与维护实训教师评语,计算机组装与维护实训计划打印版.docx

事记：关于远控软件导致win10屏幕亮度无法调节的解决方案

计算机不能打印pdf文档怎么办,pdf无法打印怎么处理_pdf文件无法打印的三种解决方法...

keil突然出现SWDJTAG Communication Failure连接失败的解决方案

最新文章

电影《志 愿 军2存亡之战》百度下载云资源[MKV5.68GB]迅雷磁力完整版

NAS安装迅雷远程下载

变形金刚3：月黑之时1280超清迅雷下载

《复仇者联盟2：奥创纪元》720高清迅雷下载

同志亦凡人第五季全集BQueer As Folk 5迅雷下载

迅雷下载每天会有限制

删除设备和驱动器中的迅雷下载、百度网盘的图标(win10、win11可用)

乡村爱情圆舞曲全集高清迅雷下载

迅雷11下载报错：下载引擎未启动

谷歌被墙，如何给谷歌浏览器添加迅雷下载插件

利用python+迅雷批量下载视频

VC++调用迅雷下载文件

迅雷下载androidsdk的各种版本

转：用迅雷下载Android SDK全系列

不用注册NVIDIA账号直接下载cuDNN的方法之使用迅雷下载到的是index.html问题解决

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

LOL弗雷尔卓德服务器维护,英雄联盟4月28日维护到几点部分大区模式维护公告...

现在如何注册台服服务器,《英雄联盟手游》台服怎么注册账号台服注册账号方法...

【91xcz英雄联盟虚空行者卡萨丁xp主题91xcz】

云顶之弈服务器维护多长时间,英雄联盟3.17更新维护时间介绍云顶之弈什么时候可以玩_18183云顶之弈专区...

电影《志愿军2存亡之战》百度下载云资源[MKV5.68GB]迅雷磁力完整版

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载