如何用python实现爬取CSDN热门评论URL并存入redis
发表于:2025-11-07 作者:千家信息网编辑
千家信息网最后更新 2025年11月07日,这篇文章主要介绍"如何用python实现爬取CSDN热门评论URL并存入redis"的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇"如何用python实现爬取CS
千家信息网最后更新 2025年11月07日如何用python实现爬取CSDN热门评论URL并存入redis
这篇文章主要介绍"如何用python实现爬取CSDN热门评论URL并存入redis"的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇"如何用python实现爬取CSDN热门评论URL并存入redis"文章能帮助大家解决问题。
一、配置webdriver
下载谷歌浏览器驱动,并配置好
import timeimport randomfrom PIL import Imagefrom selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECif __name__ == '__main__':options = webdriver.ChromeOptions()options.binary_location = r'C:UsershhhAppDataLocalGoogleChromeApplication谷歌浏览器.exe'# driver=webdriver.Chrome(executable_path=r'D:360Chromechromedriverchromedriver.exe')driver = webdriver.Chrome(options=options)#以java模块为例driver.get('https://www.csdn.net/nav/java')for i in range(1,20):driver.execute_script("window.scrollTo(0, document.body.scrollHeight)")time.sleep(2)二、获取URL
from bs4 import BeautifulSoupfrom lxml import etree html = etree.HTML(driver.page_source)# soup = BeautifulSoup(html, 'lxml')# soup_herf=soup.find_all("#feedlist_id > li:nth-child(1) > div > div > h2 > a")# soup_herftitle = html.xpath('//*[@id="feedlist_id"]/li/div/div/h2/a/@href')可以看到,一下爬取了很多,速度非常快
三、写入Redis
导入redis包后,配置redis端口和redis数据库,用rpush函数写入
打开redis
import redisr_link = redis.Redis(port='6379', host='localhost', decode_responses=True, db=1)for u in title:print("准备写入{}".format(u))r_link.rpush("csdn_url", u)print("{}写入成功!".format(u))print('=' * 30, 'n', "共计写入url:{}个".format(len(title)), 'n', '=' * 30)大功告成!
在Redis Desktop Manager中可以看到,爬取和写入都是非常的快。
要使用只需用rpop出栈就OK
one_url = r_link.rpop("csdn_url)")while one_url:print("{}被弹出!".format(one_url))关于"如何用python实现爬取CSDN热门评论URL并存入redis"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注行业资讯频道,小编每天都会为大家更新不同的知识点。
热门
评论
知识
配置
浏览器
行业
浏览
不同
实用
成功
大功告成
内容
函数
大功
实用性
实际
数据
数据库
文章
方法
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
苏州戴尔服务器哪里买
塔式服务器维修保养
appzao的软件开发者
一台服务器有几个光纤接口
wincc如何读外部数据库
长沙嵌入式软件开发团队
服务器 iscsi 管理
网络硬盘存储服务器
公安局 网络安全管理职位
服务器云服务器与
帝国神话服务器创建成功
川商互联网科技有限公司
图说普法网络安全
软件开发测试男朋友穿搭
智能辅助服务器协议书
计算机网络技术管理方向论文
网络安全 qq群主
新罗县网络安全进校园
福建正规软件开发品质保障
天龙八部69卡级服务器
医院网络安全项目论证意见
湖北科研项目管控软件开发平台
指导会员加强网络安全保护
网络技术综合题专项3
线上数据库只能半夜查询
手机怎么管理服务器数据库
网络安全准入设备有哪些
计算机网络技术自我鉴定范文
海南裕居网络技术有限公司电话
泰拉瑞亚pvp服务器怎么进