下载地址"/>
Python3 获取B站经blob处理后的真实视频下载地址
查看源代码,可看到现在B站的视频地址经过blob处理,而且在去掉blob之后,也是没有办法访问的,不能直接下载,那就只能去分析请求了
发现网页发送了这样一个请求,我们都知道B站的视频格式是 .flv的,仔细看一下这个地址的前面一小段,有…acgvideo…xxx.flv,大致就可以判定这就是真实的视频地址,但是直接复制这个地址去网页访问或者requests,是禁止访问的,因为B站加了反爬,需要添加请求头才行。
现在的问题是怎么去获取这个视频地址?要么存放在网页里,要么是经过js处理后得到的,很幸运,B站直接把这个地址放在了网页里。分析一下这个链接的请求参数,随便找一个比较有特点的参数名在网页源代码里搜一下就ok了,我这里选了trid,经过比对,发现url后面的那一长串我们想要的视频地址
以下载Dream it possible为例,用正则表达式匹配出视频地址和视频名字
import requests
import rebase_url = ''#访问起始网页需添加的请求头,不加的话,得不到完整的源代码(反爬)
base_headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0','Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3','Accept-Encoding': 'gzip, deflate, br','Accept-Language': 'zh-CN,zh;q = 0.9'}#请求视频下载地址时需要添加的请求头
download_headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0','Referer':'','Origin':'','Host':'upos-hz-mirrorkodou.acgvideo','Accept':'*/*','Accept-Encoding':'gzip, deflate, sdch, br','Accept-Language':'zh-CN,zh;q=0.8'}base_response = requests.get(base_url,headers=base_headers)
html = base_response.text
video_name = re.search('<span class="tit">(.*?)</span>',html,re.S).group(1) + '.flv'
download_url = re.search('window.__playinfo__={.*?"url":"(.*?)".*?}',html,re.S).group(1)
print(video_name)
with open(video_name, 'wb') as f:f.write(requests.get(download_url, headers=download_headers, stream=True, verify=False).content)
flv格式的视频可以用KMPlayer播放
更多推荐
Python3 获取B站经blob处理后的真实视频下载地址
发布评论