Python如何使用Requests抓取包图网小视频
发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,本篇内容介绍了"Python如何使用Requests抓取包图网小视频"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,
千家信息网最后更新 2025年12月03日Python如何使用Requests抓取包图网小视频

本篇内容介绍了"Python如何使用Requests抓取包图网小视频"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
目标抓取全站视频数据保存在本地,并以网站视频名命名视频文件。
分析网页数据结构


经分析我们可以发现总站数据我们可以从这四这选项下手
分析网页数据格式
image.png
网页数据为静态
抓取下一页链接
抓取下一页链接
OK, 上代码!
import requests
from lxml import etree
import threading
class Spider(object):
def __init__(self):
self.headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36"}
self.offset = 1
def start_work(self, url):
print("正在爬取第 %d 页......" % self.offset)
self.offset += 1
response = requests.get(url=url,headers=self.headers)
html = response.content.decode()
html = etree.HTML(html)
video_src = html.xpath('//div[@class="video-play"]/video/@src')
video_title = html.xpath('//span[@class="video-title"]/text()')
next_page = "http:" + html.xpath('//a[@class="next"]/@href')[0]
# 爬取完毕...
if next_page == "http:":
return
self.write_file(video_src, video_title)
self.start_work(next_page)
def write_file(self, video_src, video_title):
for src, title in zip(video_src, video_title):
response = requests.get("http:"+ src, headers=self.headers)
file_name = title + ".mp4"
file_name = "".join(file_name.split("/"))
print("正在抓取%s" % file_name)
with open(file_name, "wb") as f:
f.write(response.content)
if __name__ == "__main__":
spider = Spider()
for i in range(0,3):
# spider.start_work(url="https://ibaotu.com/shipin/7-0-0-0-"+ str(i) +"-1.html")
t = threading.Thread(target=spider.start_work, args=("https://ibaotu.com/shipin/7-0-0-0-"+ str(i) +"-1.html",))
t.start()
运行结果
是不是很简单呢!
"Python如何使用Requests抓取包图网小视频"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!
数据
网页
视频
分析
内容
更多
正在
知识
网站
链接
实用
学有所成
接下来
上代
全站
困境
实际
总站
情况
数据结构
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
串口服务器电池作用
sony影像数据库文件未就绪
天津特定软件开发代理价格
ctf网络安全大赛攻防
医美管理软件开发背景
廉江软件开发设计
近5年中国的网络安全事件
堡垒机怎么重启服务器
win7 服务器管理工具
samba服务器的安全等级
英雄联盟泰国服务器
数据库数据监督管理制度
必创科技是工业互联网受益股
济南数据库软件开发
设计对网络安全的绘画手抄报
数据库备份错误
重庆达埔网络技术学院
网络技术与安全专业怎样
mysql数据库生产环境故障
聊城服务器运维管理系统
广州智能照明软件开发费用
云服务器上登qq安全吗
网络安全我国实行什么制度
web服务器下载apk
sql 数据库无法定时备份
网络安全路由器怎么画
1.17小游戏服务器
c rdlc报表读取数据库
进口服务器网络机柜厂家
湖北两会网络安全