python爬取贴吧HTML页面内容

编程入门 行业动态 更新时间:2024-10-07 18:28:02

python爬取<a href=https://www.elefans.com/category/jswz/34/1713160.html style=贴吧HTML页面内容"/>

python爬取贴吧HTML页面内容


代码如下:
# -*- coding: utf-8 -*-
import urllib2
import urllib
def loadPage(url,filename):
    """
    作用:根据url发送请求,获取服务器响应文件
    url:所要爬取的url地址
    """
    print "正在下载" + filename
    headers = {"User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv2.0.1) Gecko/20100101 Firefox/4.0.1"}
    request = urllib2.Request(url,headers=headers)
    return urllib2.urlopen(request).read()
def writePage(html,filename):
    """
        作用:将html内容写入到本地
        HTML:服务器响应的文件内容
    """
    print "正在保存" + filename
    with open(filename,"w")as f:
        f.write(html)
    print "-" * 30
def tiebaSpider(url,beginPage,endPage):
    """
 

更多推荐

python爬取贴吧HTML页面内容

本文发布于:2024-02-06 13:38:24,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1749448.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:贴吧   页面   内容   python   HTML

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!