2023-11 | 短视频批量下载爬取某个用户的所有视频

admin管理员组
文章数量:1659523

这里以鞠婧祎的个人主页为demo
【2023-11-4 23:02:52 星期六】可能后面随着官方的调整, 方法不再适用, 请注意

URL地址:
aHR0cHM6Ly93d3cuZG91eWluLmNvbS91c2VyL01TNHdMakFCQUFBQUNWNUVtMTEwU2l1c0Vsd0tsSXBVZC1NUlNpOHJCWXlnME5mcFBycVpteWtIWTh3TFBROE80cHYzd1BMNkEtb3o=

找到接口

找到/aweme/v1/web/aweme/post/路劲的接口

预览响应数据, 应该是能跟所发布视频的描述所对应的就OK, 但是只只有18条数据

余下的数据, 滚动进度条的时候就会出来了

接口整整37个参数, 随便改一个都会导致请求不到数据(返回状态码200, 但就是没数据), 没想到解决办法…

将返回的数据保存到json文件中

下载视频

import requests
import json
import os

# todo 错误处理
def download_video(url, path):
    print('\n开始下载视频...', path.split('/')[-1])
    r = requests.get(url, stream=True)
    with open(path, 'wb') as f:
        # 进度条
        total_length = int(r.headers.get('content-length'))
        print('视频大小:', total_length)
        for chunk in r.iter_content(chunk_size=1024 * 1024):
            if chunk:
                f.write(chunk)
            # 打印进度条
            print('\r' + '[下载进度]:%s%.2f%%' % (
                '>' * int((f.tell() / total_length) * 50), float(f.tell() / total_length) * 100), end='')


index = 0

# json_file, 接口返回的json文件位置
# save_file_dir, 保存视频的文件夹路径
def save_video_batch(json_file, save_file_dir):
    global index
    if not os.path.exists(save_file_dir):
        os.makedirs(save_file_dir)
    # 读取json文件
    with open(json_file, 'r', encoding='utf-8') as f:
        json_data = json.load(f)
        aweme_list = json_data['aweme_list']
        for aweme in aweme_list:
            video_url_list = aweme['video']['play_addr']['url_list']
            video_name = aweme['desc']
            # 一个视频有三个地址, 成功一个就break
            index += 1
            for video_url in video_url_list:
                # print(video_url)
                try:
                    download_video(video_url, f'{save_file_dir}{index}-{video_name}.mp4')
                    break
                except Exception as e:
                    print('下载失败')


save_video_batch('../params/鞠婧祎主页.json', '../data/鞠婧祎主页/')

下载结果

尝试直接去获取html页面, 解析html页面, 但是获取的html页面并不是实际浏览器中浏览的页面(不是验证码界面我看了)

请求接口也是, API调试工具中能请求到, 但是使用代码就不行了, 也是返回200状态, 但是没有数据, 下面是代码, 不知道缺了什么
响应200但是没有数据, 试试param参数使用拼接到url后面的形式, 避免=被转义%3D
(有些敏感的数据, 需要自己替换)

现在的方法还很麻烦, 有待改进,

设想我只需要输入主页的url地址, 比如``, 自动下载主页中所有视频

改进更新

【2023-11-7 17:02:20 星期二】
已经改进了, 只需输入aHR0cHM6Ly93d3cuZG91eWluLmNvbS91c2VyL01TNHdMakFCQUFBQUNWNUVtMTEwU2l1c0Vsd0tsSXBVZC1NUlNpOHJCWXlnME5mcFBycVpteWtIWTh3TFBROE80cHYzd1BMNkEtb3o= 主页的url地址, 即可下载视频

演示视频地址
aHR0cHM6Ly93d3cuZG91eWluLmNvbS92aWRlby83Mjk4Mzg2OTIyNzk4NDY4NDA2

项目地址: https://github/tiam-bloom/DouyinSpider

现已不可用

本文标签：视频批量用户 Python

版权声明：本文标题：2023-11 | 短视频批量下载爬取某个用户的所有视频 | Python 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1729834412a1214304.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

优酷视频码率、爱奇艺视频码率、B站视频码率、抖音视频码率对比

3小时前

优酷视频码率、爱奇艺视频码率与YouTube视频码率对比优酷视频码率： 优酷的视频码率可以根据视频质量、分辨率和内容类型而变化。一般而言，优酷提供了不同的码率选项，包括较

ffmpeg视频转码（支持.qsv爱奇艺视频文件等格式的文件）

3小时前

ffmpeg下载 Download FFmpeg 下载完后进入 cmd 视频转码（支持.qsv文件） ffmpeg -i input.avm output.mp4 视频转码并截取其中一段开

两行代码下载网页视频~

3小时前

需要提醒的是，这个方法只能下载哔哩哔哩网页视频~ 1、先安装包 pip install you-get 2、下载 you-get [视频网址]

爱奇艺视频网站数据清洗整理和结论研究

2小时前

'''1、数据清洗 - 去除空值'''import numpy as npimport pandas as pd data = pd.read_csv('C:U

.qsv(爱奇艺)以及.flv(流媒体视频)视频格式转码（附转码工具）

2小时前

一些视频平台为了保护视频版权，推出自家独有的视频格式，（优酷KUX，爱奇艺QSV，腾讯QLV）&#x

爱奇艺视频QSV格式转为MP4格式----SQV格式转换

2小时前

下载地址：链接：https:pan.baidus15tB7N-AdT6zS1vQEI6wxLw 密码：0zab 转自：https:blog.

python爬取7w+『赘婿』弹幕，发现弹幕比剧还精彩！

2小时前

1.前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。 PS：如有需要Python学习资料的小伙伴可以点击下方链接自行获取 Python免费学习资料、代码以

视频转码、腾讯爱奇艺等各网站缓存文件转mp4等

2小时前

不需要下载软件，windows命令可搞定，清晰度同下载的一样且无水印如题：以腾讯视频为类，缓存的文件只有用腾讯视频才能打开，并

爱奇艺手机客服端储存的视频，如何在手机文件夹里面找到啊？

2小时前

网上许多教程都过期啦。不过方向算是正确的！ 先说在哪里：内部存储设备Androiddatacom.qiyi.videofilesappdownloadvideo 里面数字命名的文件

火爆GitHub项目，一行命令下载全网视频?

2小时前

大家好，我是为前端娱乐圈操碎了心的小迷妹，正宗前端开发一枚，每天推荐一个小工具源码，装满你的收藏夹，每天分享一个小技巧&

html 安卓视频加载错误,javascript – html5视频无法在Android webview中播放,但适用于(移动)Chrome...

2小时前

我有一个(客户)网站使用js brightcove player来渲染html5视频. (阅读：我无法编辑网站本身) 在移动Chrome中,视频有效,一切都很好.但是在我的Android应用中,使用呈现完全相同页面的W

Android 通过WebView来播放flash在线视频流，android H5播放视频

2小时前

> Android 通过WebView来播放flash在线视频流 -- Android播放flash- https:blog.csdngaryhu1articledetails78538802 android 显示fla

vue中使用Alipayer,播放rtmp,m3u8,mp4视频, vue-alipayer-v2.

1小时前

这是一个基于Alipayer 开发并封装于vue的播放器由于项目需要接入rtmp协议的直播流,用于实时监控,看了网上的几个开源播放器,最后选择了阿里云的开源播放器,Alipayer,但是Alipayer是cdn加载的,且没得一个正式的v

手机端网页视频不显示缩略图HTML,移动端H5视频页面部分体检兼容问题

1小时前

视频页面部分体检兼容问题： H5的技术已整体趋于成熟，但在视频播放方面，如果跟PC端的Flashplayer对比的话，功能就显的非常简单了。如果要让视频

android WebView加载网页视频

1小时前

使用webview加载网页视频的方法： 1，Webview wvnull; wv(WebView)findViewById(R.id.wv); wv.getSettings().setJav

视频-摄像机-推流

1小时前

本文主要介绍使用 WVPZLMediaKitMediaServerUI 实现通过 GB28181 进行海康、大华、宇视等品牌的 IPC、NVR 、DVR 接入，完成摄像头监控播放，控制&#

Android视频直播的实现

1小时前

最近一段时间，视频直播可谓大火。在视频直播领域，有不同的商家提供各种的商业解决方案，包括软硬件设备，摄像机，编码器&#xf

关于手机端视频嵌入的探索

1小时前

最近一直在做移动端，而且现在与js，jq打交道的时间远超html，css，这让编程底子本就很薄的我倍感压力，但愿能一步步顺利的克服

Python-csv文件打开、csv文件保存和csv文件删除行信息

7分钟前

以行人重识别的数据集Market1501为例，对数据集图片的18个关节点坐标文件 pckh_train.csv 进行： csv文件打开、csv文件保存和csv文件删除行信息操作。首先展示

如何在 Python 中删除文件或文件夹？

1分钟前

问： 如何删除文件或文件夹？ 答1: huntsbot汇聚了国内外优秀的初创产品创意，可按收入、分类等筛选，希望这些产品与实践经验能给您带来灵感。

电子爱好者 - 最新技术资讯及电子产品介绍！

2023-11 | 短视频批量下载爬取某个用户的所有视频 | Python

找到接口

下载视频

下载结果

改进更新

更多相关文章

优酷视频码率、爱奇艺视频码率、B站视频码率、抖音视频码率对比

ffmpeg视频转码（支持.qsv爱奇艺视频文件等格式的文件）

两行代码下载网页视频~

爱奇艺视频网站数据清洗整理和结论研究

.qsv(爱奇艺)以及.flv(流媒体视频)视频格式转码（附转码工具）

爱奇艺视频QSV格式转为MP4格式----SQV格式转换

python爬取7w+『赘婿』弹幕，发现弹幕比剧还精彩！

视频转码、腾讯爱奇艺等各网站缓存文件转mp4等

爱奇艺手机客服端储存的视频，如何在手机文件夹里面找到啊？

火爆GitHub项目，一行命令下载全网视频?

html 安卓 视频加载错误,javascript – html5视频无法在Android webview中播放,但适用于(移动)Chrome...

Android 通过WebView来播放flash在线视频流，android H5播放视频

vue中使用Alipayer,播放rtmp,m3u8,mp4视频, vue-alipayer-v2.

手机端网页视频不显示缩略图HTML,移动端H5视频页面部分体检兼容问题

android WebView加载网页视频

视频-摄像机-推流

Android视频直播的实现

关于手机端视频嵌入的探索

Python-csv文件打开、csv文件保存和csv文件删除行信息

如何在 Python 中删除文件或文件夹？

发表评论

推荐文章

六十年史诗！CPU的历史~！

世界崩塌前要写下游戏心得（持续更新）

我为什么推荐360？

flash小黄油安卓_今日软件 | 电信免费升级500M、安卓下载神器、MX Player、全能PDF工具、Chrome增强版、硬盘坏道扫描工具...

android 读build.prop,Android build.prop简介

热门文章

CPU与内存的那些事

佐罗官网zorro软件安装教程及一键新机屏蔽越狱使用方法详细简介

Android开发热门前沿知识你知道吗？学会这些2020就不用愁了(1)

如何用Python删除CSV文件的某些列 导入必要的库 读取CSV文件 删除指定的列 将修改后的数据保存回CSV文件——《跟老吕学Python编程》附录资料

Windows 11 跳过联网激活

早期windows系统手机品牌

重装Mysql删除方法和安装步骤

【半监督分割】CPCL（2023CVPR）

（10）深入理解pandas的核心数据结构：DataFrame高效数据清洗技巧

QiYi视频评论信息采集

最新文章

关于无法删除VMware虚拟机文件解决办法

后端文件上传，返回地址，前端删除文件或图片时，后台同时删除

执行git update project 后自己本地新增未提交的文件被删除了，找回方法。

java项目file.delete()方法无法删除本地文件

oracle ogg 删除,OGG 手动删除trail文件

百度网盘卸载后YunShell***.dll无法删除，提示已在文件已在其他资源中打开；删操文无法完成,因为文件已在windows资源管理器中；使用结束explore.exe的方导致电脑白屏，如何恢复。

mac服务器文件无法删除不了,Mac删除文件时一些文件被锁定不能删除的解决方法...

csv文件删除第一行

如何在 Python 中删除文件或文件夹？

c盘的Oracle文件删不了吗,在Win10系统的C驱动器上可以删除哪些文件？ C盘上无用的文件在哪里？...

python 删除文件、清空目录的方法总结

java删除xml文件内容

Tomcat日志不在输出，并且删除日志文件重启Tomcat之后日志也不会在输出

C语言文件操作，增删改查

linux文件删除正在读写的文件

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

html 安卓视频加载错误,javascript – html5视频无法在Android webview中播放,但适用于(移动)Chrome...

如何用Python删除CSV文件的某些列导入必要的库读取CSV文件删除指定的列将修改后的数据保存回CSV文件——《跟老吕学Python编程》附录资料

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载