Python简单爬虫
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,爬取链家二手房源信息import requestsimport refrom bs4 import BeautifulSoupimport csvurl = ['https://cq.lianjia.
千家信息网最后更新 2025年12月03日Python简单爬虫
爬取链家二手房源信息
import requestsimport refrom bs4 import BeautifulSoupimport csvurl = ['https://cq.lianjia.com/ershoufang/']for i in range(2,101): url.append('https://cq.lianjia.com/ershoufang/pg%s/'%(str(i))) # 模拟谷歌浏览器headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'}for u in url: r = requests.get(u,headers=headers) soup = BeautifulSoup(r.text,'lxml').find_all('li', class_='clear LOGCLICKDATA') for i in soup: ns = i.select('div[class="positionInfo"]')[0].get_text() region = ns.split('-')[1].replace(' ','').encode('gbk') rem = ns.split('-')[0].replace(' ','').encode('gbk') ns = i.select('div[class="houseInfo"]')[0].get_text() xiaoqu_name = ns.split('|')[0].replace(' ','').encode('gbk') huxing = ns.split('|')[1].replace(' ','').encode('gbk') pingfang = ns.split('|')[2].replace(' ','').encode('gbk') chaoxiang = ns.split('|')[3].replace(' ','').encode('gbk') zhuangxiu = ns.split('|')[4].replace(' ','').encode('gbk') danjia = re.findall("\d+",i.select('div[class="unitPrice"]')[0].string)[0] zongjia = i.select('div[class="totalPrice"]')[0].get_text().encode('gbk') out=open("/data/data.csv",'a') csv_write=csv.writer(out) data = [region,xiaoqu_name,rem,huxing,pingfang,chaoxiang,zhuangxiu,danjia,zongjia] csv_write.writerow(data) out.close()数据结果
二手房
数据
浏览器
源信息
结果
浏览
爬虫
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
geo数据库的图能不能直接用
暑期网络安全教育宣传片
数据库设计 用户权限管理
幼儿园网络安全排查简报
走进数据库
vue显示数据库列表
MySQL数据库加密与解密
软件开发摸底考试
网络安全学习哪些专业
南宁良庆区软件开发地址
维稳期间网络安全自查报告
网络安全公益视频在线观看
北明软件开发硬件
服务器是怎么用的
生活中影响数据库安全性事例
清华大学网络技术中心
数据库oracle的功能特点
税控盘数据库连接失败
软件开发一个月工资有多少
软件开发项目工程管理
深圳智能软件开发定制
大二计算机网络技术周一有课吗
网络安全与执法专业笔记本
MySQL数据库加密与解密
正规的服务器搬迁费用
天津五八互联网科技
携程软件开发单休还是双休
网络安全为人民活动目的
选票系统数据库设计
互联网平台开发的软件开发