python中怎么获取标题和链接
发表于:2025-12-04 作者:千家信息网编辑
千家信息网最后更新 2025年12月04日,本篇文章给大家分享的是有关python中怎么获取标题和链接,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。先上代码from request
千家信息网最后更新 2025年12月04日python中怎么获取标题和链接
本篇文章给大家分享的是有关python中怎么获取标题和链接,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
先上代码
from requests_html import HTMLSessionsession = HTMLSession()url = "https://my.oschina.net/u/4798232"r = session.get(url)for i in range(1, 12): i = str(i) urlxpath = '//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a' bt = r.html.xpath(urlxpath, first=True).text c = urlxpath+'/@href' link = r.html.xpath(c, first=True) a = "原" if bt.find(a) == -1:print(bt)print(link)else:print(bt.replace(a, ""))print(link)
首先呢,这个是通过xpath来进行操作的,具体如何复制xpath可以看我的https://zjzdmc.top/jsfx/47.html这篇文章,里面有动图。
然后导入什么库啥的,都是老生常谈的了,在a标签中,你复制的xpath为//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a这个,然后呢,我们获取标题的话,加上.text这个属性,就会变成文字了,而其中的文字我们可以看f12内的内容,发现其实只有标题,而我们如果需要连接的话,只需要加上这个/@href即可获取链接了。不过目前其实没有找到更好的获取所有文字序列的方法,所以我们直接看最前面的文章id和最后一篇文章的id,记录下来即可。之后我们只需要遍历一下1-12的值即可,然后给字符串添加变量的方法为字符串+变量+字符串即可'//*[@id="newestBlogList"]/div[1]/div['+i+']/div/a'如文字所示,即可获取所有文章的标题了,然后给之前定义的变量urlxpath后面添加上/@href后,即可获取改xpath内的链接了,之后输出即可了。
以上就是python中怎么获取标题和链接,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注行业资讯频道。
标题
链接
文字
篇文章
变量
字符
字符串
文章
方法
更多
知识
实用
老生常谈
上代
内容
只有
就是
属性
工作会
序列
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
允许直接编辑数据库在哪
数据库日志满了怎么删除
四川hp服务器维修调试费用
mysql数据库中4种字符
网页数据库编辑在哪里
svn服务器的搭建
乌班图建立日志服务器
安卓的软件开发服务
藁城软件开发项目管理在线咨询
创建mb4 数据库
阿里云rds数据库复制功能
服务器可以下载多少个网页
数据库原理第四版试题
数据库流程管理系统
怎么侵入数据库
oracle链接服务器
信元网络安全等保
服务器商会查整站网站内容吗
游戏服务器内存多少够用
南昌哪些公司做网络安全的
主机屋服务器管理
和光国际互联网科技有限公司
昆明软件开发学费
网络安全和数据库
安阳网络安全和信息化
机器学习用哪些数据库
ipad游戏服务器连不上
华为i服务器配置管理ip
夸特网络技术有限公司
上海通用软件开发价目表