如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,本篇文章为大家展示了如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。前言耗子喂汁是什么意思什么梗呢?可
千家信息网最后更新 2025年12月02日如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕
本篇文章为大家展示了如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。
前言
耗子喂汁是什么意思什么梗呢?可能很多人不知道,这个梗是出自马保国,经常上网的人可能听说过这个名字,而他所说的一些话也被当成了一些梗,比如年轻人不讲武德,闪电五连鞭等等
B站马保国的一段视频中他右眼红肿金句频出,部分经典句式甚至被网友们总结归纳成了"保国体",变成了口头禅,比如"年轻人不讲武德,欺侮我六十九岁的老同志""耗子尾汁"(好自为之)等
那么让我们来看看网友们大都发了啥弹幕
项目目标
爬取B站弹幕,词云图
第一个视频播放量快2000W了,弹幕也有4.8W
每天一遍,快乐源泉,嘿嘿嘿
环境
Python3.6
pycharm
爬虫代码
导入工具
import requestsimport parselimport csvimport time
先按F12,找到弹幕的数据在哪
从列表页中获取详情页的URL地址等数据
for page in range(20,32): time.sleep(1) print('=================正在下载11月{}日弹幕===================================='.format(page)) url = 'https://api.bilibili.com/x/v2/dm/history?type=1&oid=140610898&date=2020-11-{}'.format(page) headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36', "cookie": "__uuid=1896D3F7-4A98-54EB-F7FA-3301CE9EF5F307776infoc; buvid3=B68B2187-4C3E-4466-A896-FBF9B292099B190963infoc; LIVE_BUVID=AUTO4115757254257055; stardustvideo=1; rpdid=|(umu|ulY)JJ0J'ul~l~klRJ); sid=8cq4r229; im_notify_type_65901796=0; laboratory=1-1; DedeUserID=523606542; DedeUserID__ckMd5=909861ec223d26d8; blackside_state=1; CURRENT_FNVAL=80; SESSDATA=a976c0b4%2C1618637313%2C4d792*a1; bili_jct=7f54729ec20660f750661122b80746d2; PVID=1; bp_video_offset_523606542=458111639975213216; CURRENT_QUALITY=16; bfe_id=1e33d9ad1cb29251013800c68af42315" } response = requests.get(url=url, headers=headers) response.encoding = response.apparent_encoding selector = parsel.Selector(response.text) data = selector.css('d::text').getall() for i in data: print(i) with open('B站弹幕.csv', mode='a', newline='', encoding='utf-8-sig') as f: writer = csv.writer(f) links = [] links.append(i) writer.writerow(links)词云代码
import jiebaimport wordcloudimport imageio# 读取文件内容f = open('csv文件地址', encoding='utf-8')txt = f.read()# print(txt)# jiabe 分词 分割词汇txt_list = jieba.lcut(txt)string = ' '.join(txt_list)# 词云图设置wc = wordcloud.WordCloud( width=800, # 图片的宽 height=500, # 图片的高 background_color='white', # 图片背景颜色 font_path='msyh.ttc', # 词云字体 # mask=py, # 所使用的词云图片 scale=15,)# 给词云输入文字wc.generate(string)# 词云图保存图片地址wc.to_file('\\1.png')上述内容就是如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注行业资讯频道。
图片
耗子
视频
讲武
云图
内容
地址
出处
年轻
代码
年轻人
技能
数据
文件
知识
网友
保国
简明
人不知
好自为之
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
地球化学数据库技术
数据库系统故障的应急演练方案
网络技术专业课程设计题目
可以远程做软件开发的公司
吕梁市网络安全活动
为什么英雄连接不到服务器
int在数据库中是什么数据类型
sr590 服务器u盘装系统
网络技术团队框架
c 操作数据库的库
国家网络安全监察网
网络安全管理严格
山东企业软件开发费用
ftp服务器日志
西安软件开发找网来网去
宿迁软件开发外包
百年党建网络安全简报
公安局要求网络安全协议
uft从数据库中获得值
dns服务器数据怎么查看
如何删除服务器缓存
津南区网络安全教育
云服务器会越来越慢吗
高中生可不可以做软件开发
示范区网络安全座谈会
大学生校园网络安全工作计划
景德镇企业服务器找哪家好
国际信息技术服务发展数据库
工作组服务器管理
专利检索常用数据库