python如何爬取Q房网数据
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,这篇文章主要介绍了python如何爬取Q房网数据,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。前言本文的文字及图片来源于网络,仅供学习
千家信息网最后更新 2025年12月02日python如何爬取Q房网数据
这篇文章主要介绍了python如何爬取Q房网数据,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理
本次目标
爬取Q房网数据
https://shenzhen.qfang.com/newhouse
爬取目标数据:
小区名字
售房状态
房屋面积
户型
开盘时间
交房时间
楼盘地址
售价
预计总价

emmmm,我看看就行了,买不起买不起
开发工具
python 3.6.5
pycharm
爬虫代码
导入工具
import requestsimport parselimport csv
解析网页,爬取数据
for page in range(1, 84): print('===============================正在爬取第{}页的数据================================================='.format(page)) url = 'https://shenzhen.qfang.com/newhouse/list/n{}'.format(page) headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } response = requests.get(url=url, headers=headers) selector = parsel.Selector(response.text) lis = selector.css('.list-result li') dit = {} for li in lis: title = li.css('.list-main-header a em::text').get() # 名字 dit['标题'] = title status = li.css('.list-main-header i::text').get() # 是否在售 dit['房产状态'] = status space = li.css('.list-main div:nth-child(1) .space span::text').get() # 售房面积 dit['售房面积'] = space type_list = li.css('.list-main.fl p:nth-child(3) span a::text').getall() # 户型 type_str = '|'.join(type_list).strip().replace('\r\n', '').replace(' ', '') # 户型 dit['户型'] = type_str kp_time = li.css('.new-house-info > div:nth-child(2) > p.space.fl.clearfix > span::text').get() # 开盘时间 dit['开盘时间'] = kp_time cs_time = li.css('.new-house-info > div:nth-child(2) > p:nth-child(3)> span::text').get() # 出售时间 dit['出售时间'] = cs_time address = li.css('.list-main a:nth-child(3)::text').get() # 地址 if not address == None: address = address.strip() else: address = None dit['地址'] = address Price = li.css('.list-price .bigger .amount::text').get() # 售价 dit['售价'] = Price hj_Price = li.css('.list-price .smaller::text').get() # 预计总价 dit['预计总价'] = hj_Price保存数据
f = open('房产数据.csv', mode='a', encoding='utf-8-sig', newline='')csv_writer = csv.DictWriter(f, fieldnames=['标题', '房产状态', '售房面积', '户型', '开盘时间', '出售时间', '地址', '售价', '预计总价'])csv_writer.writeheader()print(dit)运行代码,效果如下图
感谢你能够认真阅读完这篇文章,希望小编分享的"python如何爬取Q房网数据"这篇文章对大家有帮助,同时也希望大家多多支持,关注行业资讯频道,更多相关知识等着你来学习!
数据
时间
户型
售价
地址
总价
篇文章
面积
房网
房产
状态
代码
名字
工具
标题
目标
学习
价值
兴趣
前言
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络技术专业课程设计题目
网络安全审查涉及app
深圳市西风网络技术股份
标准服务器机箱分析
守望先锋所有服务器
邯郸人工智能软件开发报价
物理学专业转软件开发
户外网络服务器
web服务器安全实验报告
云服务器管理费
怎么快速替换数据库
辽宁智慧养老软件开发
wifi损坏 转移数据库
北京爱乐网络技术
江西特色软件开发收购价格
虚拟机火狐浏览器找不到服务器
高中网络技术运用选择
简述软件开发工具的技术要素
原神官服属于哪个服务器
宝塔面板如何切换数据库版本
我的世界荣耀战神服务器在哪里
如何检测服务器端口被占用
财经互联网科技
读写频繁的数据库
网络安全对学生目的
网络技术学院大学排名
obsrtsp 服务器
南华大学共建网络安全实验室
悠悠导航软件开发
怎么看服务器后台内存