怎么用Python采集雪中悍刀行的弹幕做成词云
发表于:2025-11-13 作者:千家信息网编辑
千家信息网最后更新 2025年11月13日,这篇文章主要为大家展示了"怎么用Python采集雪中悍刀行的弹幕做成词云",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"怎么用Python采集雪中悍刀行的弹
千家信息网最后更新 2025年11月13日怎么用Python采集雪中悍刀行的弹幕做成词云
这篇文章主要为大家展示了"怎么用Python采集雪中悍刀行的弹幕做成词云",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"怎么用Python采集雪中悍刀行的弹幕做成词云"这篇文章吧。
前言
最近已经播完第一季的电视剧《雪中悍刀行》,从播放量就可以看出观众对于这部剧的期待,总播放量达到50亿,可让人遗憾的是,豆瓣评分只有5.7,甚至都没有破6。
很多人会把这个剧和《庆余年》做对比,因为主创班底相同
400余万字的同名小说曾被捧为网文界里的"名著",不少粉丝早就对跨界改编有所期待,剧版的主创班底、出品方与2019年的爆款剧《庆余年》相同则放大了这份期待。然而《雪中悍刀行》播出后,书粉的怒火蔓延到了各类讨论场合。
今天就来采集这部剧的一部分视频弹幕,看看观众都说了啥,为什么播放量高,口碑却低
知识点介绍
requests模块的使用
pandas保存表格数据
pyecharts做词云图可视化
环境介绍
python 3.8
pycharm
requests >>> pip install requests
pyecharts >>> pip install pyecharts
代码实现
1. 导入模块
import reimport requests # 发送网络请求import pandas as pd # 保存数据
2. 发送网络请求
headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'}# 构建一个列表储存数据data_list = []for page in range(15, 1500, 30): url = f'https://mfm.video.qq.com/danmu?otype=json&target_id=7626435152%26vid%3Dp0041oidttf&session_key=0%2C174%2C1642248894×tamp={page}' esponse = requests.get(url=url, headers=headers)3. 获取数据 弹幕内容
json_data = response.json()
4. 解析数据(筛选数据) 提取想要的一些内容 不想要的忽略掉
comments = json_data['comments']print(comments)for comment in comments: data_dict = {} data_dict['commentid'] = comment['commentid'] content = comment['content'] content = re.sub(r'[\x0e\xa0]', '', content) data_dict['content'] = content data_dict['opername'] = comment['opername'] print(data_dict) data_list.append(data_dict)5. 保存数据
df = pd.DataFrame(data_list)# 乱码, 指定编码 为 utf-8 或者是 gbk 或者 utf-8-sigdf.to_csv('data.csv', encoding='utf-8-sig')6. 词云图可视化
import jiebafrom pyecharts.charts import WordCloudimport pandas as pdfrom pyecharts import options as optswordlist = []data = pd.read_csv('data.csv')['content']dataa = [list(z) for z in zip(word, count)]c = ( WordCloud() .add('', a, word_size_range=[10, 50], shape='circle') .set_global_opts(title_opts=opts.TitleOpts(title="词云图")))c.render_notebook()以上是"怎么用Python采集雪中悍刀行的弹幕做成词云"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!
数据
内容
云图
篇文章
相同
余年
模块
班底
知识
网络
观众
主创
可视化
学习
帮助
成功
遗憾
乱码
代码
前言
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
数据库设计思路与原则
软件开发质量控制证书有效期
杭州煎饼网络技术怎么样
弱电工程与软件开发
配置数据库优化性能参数
软件开发中文
互联网之光上的高科技
怀旧服服务器会卡吗
税控服务器是什么
数据库 分页插件
数据库如何实现多条修改
替换数据库中同一个关键字
如何查看连接数据库的密码
聚数据库
切实贯彻网络安全
求生之路2弑神巅峰服务器群号
服务器插上无线网卡无反应
先进网络安全管理
怎么加强数据库的安全防范
服务器加硬盘后识别不了
枪战英雄找不到服务器
考网络安全工程师要学什么
银行软件开发人员招聘笔试
七日杀服务器怎么设置开箱子
小学生购物网络安全知识
技术管理网络安全
网络安全管理和计算机科学与技术
华三杯网络技术大赛2019
口碑好的云服务器哪家便宜
山西erp 软件开发询问报价