Python3 获取B站经blob处理后的真实视频下载地址

编程入门行业动态更新时间:2024-10-26 12:23:05

Python3 获取B站经blob处理后的真实视频<a href=https://www.elefans.com/category/jswz/34/1769932.html style= 下载地址"/>

Python3 获取B站经blob处理后的真实视频下载地址

查看源代码，可看到现在B站的视频地址经过blob处理，而且在去掉blob之后，也是没有办法访问的，不能直接下载，那就只能去分析请求了

发现网页发送了这样一个请求，我们都知道B站的视频格式是 .flv的，仔细看一下这个地址的前面一小段，有…acgvideo…xxx.flv，大致就可以判定这就是真实的视频地址，但是直接复制这个地址去网页访问或者requests，是禁止访问的，因为B站加了反爬，需要添加请求头才行。

现在的问题是怎么去获取这个视频地址？要么存放在网页里，要么是经过js处理后得到的，很幸运，B站直接把这个地址放在了网页里。分析一下这个链接的请求参数，随便找一个比较有特点的参数名在网页源代码里搜一下就ok了，我这里选了trid，经过比对，发现url后面的那一长串我们想要的视频地址

以下载Dream it possible为例，用正则表达式匹配出视频地址和视频名字

import requests
import rebase_url = ''#访问起始网页需添加的请求头，不加的话，得不到完整的源代码（反爬）
base_headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0','Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3','Accept-Encoding': 'gzip, deflate, br','Accept-Language': 'zh-CN,zh;q = 0.9'}#请求视频下载地址时需要添加的请求头
download_headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0','Referer':'','Origin':'','Host':'upos-hz-mirrorkodou.acgvideo','Accept':'*/*','Accept-Encoding':'gzip, deflate, sdch, br','Accept-Language':'zh-CN,zh;q=0.8'}base_response = requests.get(base_url,headers=base_headers)
html = base_response.text
video_name = re.search('<span class="tit">(.*?)</span>',html,re.S).group(1) + '.flv'
download_url = re.search('window.__playinfo__={.*?"url":"(.*?)".*?}',html,re.S).group(1)
print(video_name)
with open(video_name, 'wb') as f:f.write(requests.get(download_url, headers=download_headers, stream=True, verify=False).content)

flv格式的视频可以用KMPlayer播放

更多推荐

Python3 获取B站经blob处理后的真实视频下载地址

本文发布于:2024-03-06 07:54:00，感谢您对本站的认可！

本文链接:https://www.elefans.com/category/jswz/34/1714776.html