链家爬虫python

编程入门 行业动态 更新时间:2024-10-20 03:31:53

链家<a href=https://www.elefans.com/category/jswz/34/1770264.html style=爬虫python"/>

链家爬虫python

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

买房装修,是每个人都要经历的重要事情之一。相对于新房交易市场来说,如今的二手房交易市场一点也不逊色,很多二手房的信息刚刚挂出来,就被其他购房者拿下了。

项目目标

爬取链家网二手房信息

受害者地址

/

基本环境配置

python 3.6

pycharm

代码

导入工具

import requests

import parsel

import time

请求网页,爬取数据

for page in range(1, 101):

print('===========================正在下载第{}页数据================================'.format(page))

time.sleep(1)

url = '{}/'.format(page)

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'

}

response = requests.get(url=url, headers=headers)

selector = parsel.Selector(response.text)

lis = selector.css('.sellListContent li')

dit = {}

for li in lis:

title = li.css('.title a::text').get()

dit['标题'] = title

positionInfo = li.css('.positionInfo a::text').getall()

info = '-'.join(positionInfo)

dit['开发商'] = info

houseInfo = li.css('.houseInfo::text').get()

dit['房子信息'] = houseInfo

followInfo = li.css('.followInfo::text').get()

dit['发布周期'] = followInfo

Price = li.css('.totalPrice span::text').get()

dit['售价/万'] = Price

unitPrice = li.css('.unitPrice span::text').get()

dit['单价'] = unitPrice

csv_writer.writerow(dit)

print(dit)

保存数据

import csv

f = open('二手房信息.csv', mode='a', encoding='utf-8-sig', newline='')

csv_writer = csv.DictWriter(f, fieldnames=['标题', '开发商', '房子信息', '发布周期', '售价/万', '单价'])

csv_writer.writeheader()

运行代码,效果如下

本文分享 CSDN - 松鼠爱吃饼干。

如有侵权,请联系 support@oschina 删除。

本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

更多推荐

链家爬虫python

本文发布于:2024-02-24 14:40:55,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1695644.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:爬虫   链家   python

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!