python使用scrapy爬取qq音乐（一）|电子爱好者

admin管理员组
文章数量:1646328

url分析，拿到初始url（start_url）

要爬取的内容为qq音乐的排行榜中的歌曲，首先我们要分析url：

1.打开qq音乐的首页，点击排行榜，右键，检查（谷歌浏览器，其他浏览器各有不同，360浏览器为：审查元素）。

2.右键，检查：

3.
我们要分析所有向后台发出的请求，找出有用的url。点击Network，然后刷新页面。我们会看到有很多请求。
我们对所有的请求进行过滤和筛选，此时选用最笨的方法，手动查找，点击Response，只查看返回的信息。然后依次点击，左侧请求，查找有用的请求数据

4.我们看到，当点击fcg_v8_toplist_opt.fcg?……….时，右边的response中出来一串数据，当然，出来类似数据的有那么几条请求，此时就需要一个个的点开查看了。看看有没有我们想要的或者相关的数据。这时，我们可以点击Preview更方便的进行查看

这里的我们可以获取到每个榜单的topid，这就是我们需要的数据。为什么topid是有用的，别的没用么？其实我们可以从一首歌曲歌曲逆向推理，歌曲的url是什么，怎么得到的，需要哪些必要的参数。逆向的话更容易些。这篇博客我们正着写。（当然，我也是逆向分析的-_-）
知道这个请求有用后，我们需要获取它完整的请求的url。我们可以通过分析headers中的request请求，拼接出完整的url

https://c.y.qq/v8/fcg-bin/fcg_v8_toplist_opt.fcg?page=index&format=html&tpl=macv4&v8debug=1&jsonCallback=jsonCallback

空白的蓝色框就是完整的url，这就是我们的初始url了。
我们把这个url复制，粘贴到浏览器的地址栏，就能返回一堆数据，这里面就隐藏了我们需要的数据，后面我们还得想办法（正则、xpath、python字典。。。。等方法）把我们需要的数据提取出来。

通过浏览器返回的数据，我们发现，去除【jsonCallback( 】和最后的【）】后，剩下的就是json格式的字符串，这样最好了，给了我们处理数据的多种方法。

url分析，拿到表单详情页的url（start_url）

除了上面的请求有我们需要的数据外，我们查找的过程中，还发现一个请求返回的数据有歌曲的信息。

https://c.y.qq/v8/fcg-bin/fcg_v8_toplist_cp.fcg?tpl=3&page=detail&date=2017_33&topid=3&type=top&song_begin=0&song_num=30&g_tk=5381&jsonpCallback=MusicJsonCallbacktoplist&loginUin=0&hostUin=0&format=jsonp&inCharset=utf8&outCharset=utf-8&notice=0&platform=yqq&needNewCode=0

我们使用之前的方法拿到完整的url还记得Headers中的request请求头么，对，就是在那。或者我们右键图中蓝色部分，拷贝完整linkurl就行。哇咔咔，这个url怎么这么长，太难看了。通过我们手动测试后，得到精简版的url：

    https://c.y.qq/v8/fcg-bin/fcg_v8_toplist_cp.fcg?topid=4

这个不错吧，吧它复制到浏览器地址栏，回车一下，嗯，嗯？这是神马东东，这么多字？没错，我们又偷偷的笑了，这就是一个完整的json字符串。哈哈哈。找到宝藏了，里面就是歌曲信息哦。不用再分析网页的源码了有木有。
看到url中的topid没，我们已经从上一个的url拿到很多的topid啦。这样，每个榜单的歌曲列表我们就已经拿到了。
如果只需要拿到歌曲信息，而不是歌曲的小伙伴到这可以停下了。不满足的可以接着往下面看。

本文标签：音乐 Python scrapy qq

版权声明：本文标题：python使用scrapy爬取qq音乐（一）内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1729446515a1201457.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

python使用scrapy爬取qq音乐（一）

url分析，拿到初始url（start_url）

url分析，拿到表单详情页的url（start_url）

更多相关文章

从进程中获取QQ号码

ubuntu下安装wine1.8+QQ音乐

SQL第十三章QQ

stats.probplot(QQ图)

怎样封别人的qq号

Java 基于JavaMail实现QQ邮件发送（也可实现群发）

友盟社会化分享 判断是否 安装客户端（微信、QQ、新浪微博）

qq主要用的是哪个协议？tcp or udp？

QQ群排名优化技巧

qq在线客服代码（不需要加好友）

QQ运行崩溃：androidassist.dll异常

QQ在线咨询显示 未启用【解决方法】

腾讯 QQ for Linux 的安装及 tar.gz版本QQ 建立快捷方式

解决从onenote 中文字复制后再粘贴到QQ变成图片格式

三星S3601C安装qq

非QQ会员如何克隆好友

美味连连-QQ游戏辅助-简单实用的QQ游戏美味连连辅助(非外挂)

QQ通讯协议

安卓使用无障碍服务监听微信和QQ的收款信息

全文六万字《计算智能》智能优化算法 张军【Python】

发表评论

推荐文章

解决Win11右键菜单问题

Team Culture

计算机突然断电或死机 重启后,电脑突然断电后引起电脑死机! 然后就没法开机!该怎么弄?...

飞畅科技V.35协议转换器指示灯告警说明详细介绍

R QQplot的demo和理解

热门文章

InnoDB内存架构之日志缓冲区

win11电脑锁屏时间怎么设置,win11怎么设置锁屏时间

Win11如何修改用户名？

GOOGLE工具大全+搜索引擎免费登陆入口

U盘数据恢复大师，新手推荐这四款！

【专业修复指南】优盘文件或目录损坏？教你一键恢复数据

如何解决Could not load file or assembly ‘xxx.yyy, version=1.0.0.0, culture=neutral, public

“一文读懂“系列：Android中的硬件加速

使用win10自带的手机投屏功能

计算机如何获取界面,电脑启动时怎么进入GHOST界面 系统如何获取打开Ghost方法技巧...

最新文章

【植物大战僵尸杂交版】最新版下载链接

【MSFconsole工具】下载、启动方法、msf常用基础命令、模块功能、核心命令（入门初识）

Windows 下 hoj后端本地启动

电脑windows系统和安卓系统区别

计算机更新有用吗,驱动有必要升级吗_n卡驱动有必要更新吗

Xiaomi Redmi Note7刷机

Charles下载抓包基本流程

服务器2012系统评估版,解决windows server2012 评估版本过期，系统会自动关机

从电脑上便捷地操控您的手机（Android &amp; iOS） | 7 个强大的工具

GeoServer下载与安装（Windows版）

oppo自带计算机版本,OPPO手机助手

Windows：用appium运行iOS真机自动化测试

Win连接android打印机,教你用AndroidIphoneMacWindows和群晖实现无线打印

Windows7：在睡眠时也能下载

Dplayer Android播放器,呆呆播放器手机版官方下载

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

友盟社会化分享判断是否安装客户端（微信、QQ、新浪微博）

QQ在线咨询显示未启用【解决方法】

全文六万字《计算智能》智能优化算法张军【Python】

计算机突然断电或死机重启后,电脑突然断电后引起电脑死机! 然后就没法开机!该怎么弄?...

计算机如何获取界面,电脑启动时怎么进入GHOST界面系统如何获取打开Ghost方法技巧...

从电脑上便捷地操控您的手机（Android & iOS） | 7 个强大的工具

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载