admin管理员组

文章数量:1619289

#!/usr/bin/env python
# -*- coding:utf-8 -*-
#@author:Chris iven
#Python version 3.6




#1.分析LOL官网行为!
#发现这个网页的所有数据都是经过js生成的!意思就是说 他的数据全部不在该网页里面,而是在一个JS文件里面!
#所以我们只需要获取JS数据.


"""
抓取步骤及思路:


1.获取英雄的js数据,访问并且下载.然后转换为JSON格式的数据.


2.对数据进行解析,我们这边的函数式get_hero_data!
这个函数会对下载的json数据进行解析,提取出LOL中的英雄英文名字和id值!


3.访问并且下载:
    对于获取的数据进行拼接,尤其是对图片的链接进行拼接.然后进行下载!
    
github 源文件: https://github/ivcr/PythonSpider/blob/master/LOL/LOL_Spider

 

源码:

#!/usr/bin/env python
# -*- coding:utf-8 -*-
#@author:Chris iven
#Python version 3.6


#1.分析LOL官网行为!
#发现这个网页的所有数据都是经过js生成的!意思就是说 他的数据全部不在该网页里面,而是在一个JS文件里面!
#所以我们获取JS文件即可!

import requests
import json,re,os
class LOL_Spider(object):
    def __init__(self,url):
        self.url &

本文标签: 英雄爬虫皮肤联盟