喜欢关于音乐的美文,听听作者的故事——爬取Luoo的音乐故事

编程入门 行业动态 更新时间:2024-10-20 07:46:04

喜欢关于音乐的美文,听听作者的<a href=https://www.elefans.com/category/jswz/34/1769346.html style=故事——爬取Luoo的音乐故事"/>

喜欢关于音乐的美文,听听作者的故事——爬取Luoo的音乐故事

朋友推荐过Luoo的音乐,非常喜欢。自己用Python写了爬取文章的代码。
#!/usr/bin/env python
# -*- coding: cp936 -*-
from bs4 import BeautifulSoup
import FileUtil
import urllib2;
import urllib
import time
def getEssay():print 'about to get essay'baseurlLoo = '/';for x in range(84,100):print xcontent = urllib2.urlopen(baseurlLoo+str(x)).read();soup = BeautifulSoup(''.join(content));if soup.findAll('div','error-msg'):continue;else : title = soup.find('h1','essay-title').textessayCont = soup.find('div','essay-content').text;FileUtil.mkDir('./'+title)FileUtil.saveFile('./'+title+'/'+title+'.txt',essayCont)Essay = soup.find('div','essay-content');picUrls = Essay.findAll('img')for div in picUrls:picUrl = dict(div.attrs)['src']last = picUrl.rfind('/')picName = picUrl[last+1:]urllib.urlretrieve(picUrl,'./'+title+'/'+title+picName)print 'essay get over'if __name__=="__main__":getEssay()
 FileUtil 为个人使用的工具包,需要的话可以自己写。 
          

更多推荐

喜欢关于音乐的美文,听听作者的故事——爬取Luoo的音乐故事

本文发布于:2024-02-12 05:31:01,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1686325.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:故事   音乐   美文   喜欢   作者

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!