怎么用Python爬取惠农网苹果数据
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,这篇文章将为大家详细讲解有关怎么用Python爬取惠农网苹果数据,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。本次目标爬取惠农网信息受害者地址http
千家信息网最后更新 2025年12月02日怎么用Python爬取惠农网苹果数据
这篇文章将为大家详细讲解有关怎么用Python爬取惠农网苹果数据,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
本次目标
爬取惠农网信息
受害者地址
https://www.cnhnb.com/
环境
Python3.6
pycharm
爬虫代码
导入工具
import requestsimport parselimport csvimport time
请求头
headers = { 'Cookie': 'deviceIdRenew=1; Hm_lvt_91cf34f62b9bedb16460ca36cf192f4c=1604579356,1604659451; deviceId=d1dd5b9-d191-406b-971d-391916a0e; sessionId=S_0KH64T2IHLHSO77N; lmvid=b24dcd0ad2a8f0b783f248c7ff2675a8; lmvid.sig=w1UBnTUKSDq-GfAlx6TyR_K7SjyujGIlF-1kRjTrOAI; hnUserTicket=b80e6b3a-38a3-432c-816d-aeb0376228bd; hnUserId=870048250; Hm_lpvt_91cf34f62b9bedb16460ca36cf192f4c=1604659904', 'Host': 'www.cnhnb.com', 'Referer': 'https://www.cnhnb.com/supply/pingguo/', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',}解析网站、爬取数据
def get_page_url(page_url, page_id): response_2 = requests.get(url=page_url, headers=headers) selector_2 = parsel.Selector(response_2.text) num_id = selector_2.css('#__layout > div > div > div > div > ul > li:nth-child(1) > a::attr(href)').get().split('/')[2] title = selector_2.css('.proinfo-title::text').get().strip() # 标题 update_time = selector_2.css('.update-time::text').get().strip('更新时间:') # 更新时间 price = selector_2.css('.priceTxt .orange .fs30::text').get().strip() + '元' # 价格 ads = selector_2.css('div:nth-child(5) > span.fs14.gray6::text').get() # 发货地址 get_phone_url = 'https://gateway.cnhnb.com/banana/im/operate/wechatcall' data = { 'businessType': '1', 'sourceFrom': '2', 'ticket': '"b80e6b3a-38a3-432c-816d-aeb0376228bd"', 'userId': '{}'.format(num_id), } head = { 'authority': 'gateway.cnhnb.com', 'method': 'POST', 'path': '/banana/im/operate/wechatcall', 'scheme': 'https', 'accept': 'application/json, text/plain, */*', 'accept-encoding': 'gzip, deflate, br', 'accept-language': 'zh-CN,zh;q=0.9', 'cache-control': 'no-cache', 'content-length': '98', 'content-type': 'application/json', 'origin': 'https://www.cnhnb.com', 'pragma': 'no-cache', 'referer': 'https://www.cnhnb.com/gongying/{}/'.format(page_id), # 'Cookie': 'deviceIdRenew=1; Hm_lvt_91cf34f62b9bedb16460ca36cf192f4c=1604579356,1604659451; deviceId=d1dd5b9-d191-406b-971d-391916a0e; sessionId=S_0KH64T2IHLHSO77N; lmvid=b24dcd0ad2a8f0b783f248c7ff2675a8; lmvid.sig=w1UBnTUKSDq-GfAlx6TyR_K7SjyujGIlF-1kRjTrOAI; hnUserTicket=b80e6b3a-38a3-432c-816d-aeb0376228bd; hnUserId=870048250; Hm_lpvt_91cf34f62b9bedb16460ca36cf192f4c=1604659904', 'sec-fetch-dest': 'empty', 'sec-fetch-mode': 'cors', 'sec-fetch-site': 'same-site', 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36', 'x-b3-traceid': '0KH64WG5WL1GXPNG', 'x-client-appid': '5', 'x-client-id': 'c10e4e9a-5e19-4ba2-a934-c8c5c56680f5', 'x-client-nonce': '62f080cd-ad30-4590-b362-b1c9e660a8d5', 'x-client-page': '/gongying/{}/'.format(page_id), 'x-client-sid': 'S_0KH64W0GT18JX07L', 'x-client-ticket': 'b80e6b3a-38a3-432c-816d-aeb0376228bd', 'x-client-time': '1604659611092', 'x-hn-job': 'If you see these message, I hope you dont hack us, I hope you can join us! Please visit https://www.cnhnkj.com/job.html', } response_3 = requests.post(url=get_phone_url, json=data, headers=head) html_data = response_3.json() if html_data['errorCode'] == 0: dit = { '标题': title, '更新时间': update_time, '价格': price, '发货地址': ads, '联系方式': html_data['data']['messageTitle'] } csv_writer.writerow(dit) print(dit) else: dit = { '标题': title, '更新时间': update_time, '价格': price, '发货地址': ads, '联系方式': '商家设置防打扰' } csv_writer.writerow(dit) print(dit)保存数据
f = open('惠农网信息.csv', mode='a', encoding='utf-8-sig', newline='')csv_writer = csv.DictWriter(f, fieldnames=['标题', '更新时间', '价格', '发货地址', '联系方式'])csv_writer.writeheader()效果图
关于怎么用Python爬取惠农网苹果数据就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
地址
时间
更新
数据
惠农
价格
标题
方式
联系方式
联系
苹果
信息
内容
文章
更多
知识
篇文章
不错
代码
受害者
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络安全法 实施办法
软件开发可研报告目录
名字攻击服务器
江苏一站式软件开发工具
网络技术服务所得税税率
动易表单数据库
济南思新网络技术有限公司
远程数据库如何导出
公安部网络安全专业技能培训证书
网络安全操作维护中心
普陀区服务器回收厂家哪里有
国家网络安全宣传周开幕啦
南京李董得网络技术有限公司
计算机网络技术和维修
目前氛围比较好的服务器
兄弟打印机服务器错误怎么办
拳头平台无法连接服务器
百单网互联网科技官网
数据库名称简称
win7音频服务器怎么打开
移动通信网络技术专业排名
网络安全设备管理类联考
软件开发工程师一3职称等级
成都直销软件开发多少钱
博兴蒲乘互联网科技有限公司
华为无法联系到服务器怎么回事
数据库文件过大无法备份
戴尔720服务器是什么主板
徐州企业软件开发中心
万方数据库有哪些特殊功能