下载图片后,尝试下载mooc的视频"/>
学习基础request请求下载图片后,尝试下载mooc的视频
学习基础request请求下载图片后,尝试下载mooc的视频
1.爬取国家地理杂志图片 命名为abc
import requests
path="C:/Users/peppa/Pictures/abc.jpg"
url=".jpg"
r=requests.get(url)
try:r.raise_for_status()print(r.status_code)with open(path,"wb") as f:f.write(r.content)f.close
except:print("爬取错误")
2.try2 爬取后存放至指定路径并且以原文件名称命名
import requests
import os
# url=".jpg"
url=".jpg"
root="C:/Users/peppa/Pictures/"
path=root+url.split("/")[-1]
try:if not os.path.exists(root):os.mkdirs(root)***
#os.makedirs会递归的建立输入的路径,即使是上层的路径不存在,它也会建立这个路径,而os.mkdir父级路径不存在,那么就会报错***。if not os.path.exists(path):r = requests.get(url)with open(path,"wb") as f: #f=open(path,r) f.简化用法f.write(r.content)f.close()else:print("文件已存在")
except:print("爬取失败")
**
待解决
**:尝试下载Mooc视频,添加了cookie和ua,进入了播放页面但是找不到视频存放地址对应接口,
import requests
import json
import os
index=0
url="=1206951268#/learn/content?type=detail&id=1211970243"
path='F:/BaiduNetdiskDownload/'
try:headers={'cookie' :' ','User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'}r = requests.get(url, headers)print(r.text)#网页爬取成功,查看打印内容和当前页面源代码一致,但是下载失败,因为找不到视频接口r.raise_for_status()print(r.status_code)with open(path,"wb") as f:f.write(r.content)f.close
except:print("爬取错误")
更多推荐
学习基础request请求下载图片后,尝试下载mooc的视频
发布评论