HTML下载模块是怎样的
发表于:2025-12-01 作者:千家信息网编辑
千家信息网最后更新 2025年12月01日,这篇文章给大家介绍HTML下载模块是怎样的,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。HTML下载模块该模块主要是根据提供的url进行下载对应url的网页内容。使用模块requ
千家信息网最后更新 2025年12月01日HTML下载模块是怎样的
这篇文章给大家介绍HTML下载模块是怎样的,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。
HTML下载模块
该模块主要是根据提供的url进行下载对应url的网页内容。使用模块requets-HTML,加入重试逻辑以及设定最大重试次数,同时限制访问时间,防止长时间未响应造成程序假死现象。
根据返回的状态码进行判断如果访问成功则返回源码,否则开始重试,如果出现异常也是进行重试操作。
from requests_html import HTMLSession
from fake_useragent import UserAgent
import requests
import time
import random
class Gethtml():
def __init__(self,url="http://wwww.baidu.com"):
self.ua = UserAgent()
self.url=url
self.session=HTMLSession(mock_browser=True)
#关于headers有个默认的方法 self.headers = default_headers()
#mock_browser 表示使用useragent
def get_source(self,url,retry=1):
if retry>3:
print("重试三次以上,跳出循环")
return None
while retry<3:
try:
req=self.session.get(url,timeout=10)
if req.status_code==requests.codes.ok:
return req.text
else:
time.sleep(random.randint(0,6))
except:
print('An Error Happened, Please wait 0-6 seconds')
time.sleep(random.randint(0, 6))
retry += 1
self.get_source(url,retry)关于HTML下载模块是怎样的就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
模块
内容
更多
帮助
不错
最大
成功
兴趣
同时
小伙
小伙伴
文章
方法
时间
次数
源码
状态
现象
知识
程序
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
个人云盘数据库技术与应用
数据库管理英文全称
客户端服务器端属于什么
常见的数据库高可用技术
网络安全考试一般多少分及格
高中生网络安全班会ppt
服务器2核和4核
熙光网络技术传媒公司
小学生网络安全活动感想
服务器安全启动按键
沈阳商城软件开发放心省心
建立数据库保存火车班次
电力行业网络安全工作方案报价
医院数据库管理制度
职教中心网络技术
年度网络安全目标
深圳鹰创互联网科技有限公司
江干区 软件开发公司
银行外包软件开发不是人干的
软件开发驻场承诺书
网络技术测试卷
大连租房网络安全
vivo的软件开发事情多吗
mdb数据库操作
太原市公安局网络安全宣传周
网络安全的重中之重
手机网络安全密匙在哪里找
小度播放网络安全手抄报知识
新媒体 卷烟消费者数据库
存储服务器硬盘与普通硬盘