如何使用python爬取知乎全部回答
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,小编给大家分享一下如何使用python爬取知乎全部回答,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!1.代码逻辑这个核心代
千家信息网最后更新 2025年12月03日如何使用python爬取知乎全部回答
小编给大家分享一下如何使用python爬取知乎全部回答,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
1.代码逻辑
这个核心代码是直接对上篇推文中使用的代码进行修改,删去了对书籍名称的提取,添加了爬取内容的写入文件,小伙伴只要把getAnswers(问题号)里的传入参数改成想爬取回答的问题号,剩下的事情就只需要等待了
什么是知乎问题号?
查看知乎网页地址,question后的一串数字就是问题号
def getAnswers(qid):
offset = 0
num = 1
f = open("知乎回答%s.txt" % qid, "a")
while True:
qid = qid
print('Offset =', offset)
# 知乎api请求
data = getAnser(qid, offset)
print(data)
if len(data['data']) == 0:
break
for line in data['data']:
# 保存回答数据
content = line['content']
pattern = re.compile(r'<[^>]+>', re.S)
result = pattern.sub('', content)
print(result)
f.write("\n【第%d个回答】" % num)
num += 1
f.write(result)
offset += 20
time.sleep(1)
f.close()
getAnswers(62096167)
2.应用程序版本
对于不了解爬虫的小伙伴,只需要打开一行数据爬取知乎回答.exe,修改问题号和选择保存路径,就可以将该知乎问题下的所有回答保存到当前路径下,如下图所示

以上是"如何使用python爬取知乎全部回答"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!
题号
代码
内容
篇文章
小伙
小伙伴
数据
路径
一行
上篇
不怎么
书籍
事情
参数
名称
地址
大部分
就是
应用程序
数字
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
数据库系统阶段冗余性
天门在线数据采集软件开发
服务器指的是在网络环境中
服务器安装和配置需要注意什么
五年级网络安全文字
长城超云服务器安装红帽6.8
网络安全手抄报字少的
永劫无间服务器在杭州吗
网络安全工作短期目标和长远规划
四川未来无界网络技术
网络安全学习美篇小学
部门联合进驻网络安全审查
计算机网络技术跟影视
宁波手机游戏软件开发怎么选
开森网络技术服务
软硬兼修服务器
服务器硬件和软件如何安装
县法院建立管理人履职信息数据库
江阴dell服务器维修站
mc地球都市服务器x
傲世战神服务器错误代表什么
安装myspl数据库实验原理
四数据库提取基因
小米枪战服务器资源不足怎么回事
有精通万方数据库的吗
宝山区管理网络技术服务值得推荐
数据库三级比二级难吗
利用各大社交软件开发新用户
2020十大软件开发
罗伯特卡恩世界网络技术