scrapy随机更改User-Agent方法
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,1 Scrapy设置User-Agent1.1 在settings.py文件中设置USER_AGENT参数即可实现1.1.1 使用固定User-Agent方法在settings.py文件中加入如下代码
千家信息网最后更新 2025年12月02日scrapy随机更改User-Agent方法
1 Scrapy设置User-Agent
1.1 在settings.py文件中设置USER_AGENT参数即可实现
1.1.1 使用固定User-Agent方法
在settings.py文件中加入如下代码即可(USER_AGENT是固定写法),具体使用什么agent可以自己更改下面蓝色字体内容。
USER_AGENT = 'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Win64; x64; Trident/5.0; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET CLR 2.0.50727; Media Center PC 6.0)
1.1.2 使用随机User-Agent方法
在settings.py文件中通过创建一个agent列表,然后通过从中随机取出1个赋值给USER_AGENT变量即可
代码如下:
import random
UserAgentList = [
"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Win64; x64; Trident/5.0; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET CLR 2.0.50727; Media Center PC 6.0)",
"Mozilla/5.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET CLR 1.0.3705; .NET CLR 1.1.4322)",
]
USER_AGENT = random.choice(UserAgentList)
1.1.3 使用第三方user-agent库(fake-useragent)实现设置agent方法
在settings.py文件中加入如下代码:
from fake_useragent import UserAgent
ua = UserAgent()
USER_AGENT = ua.random
1.2 通过写middleware方法实现
1.2.1 通过在setting文件中自己编写user-agent方法
在setting.py文件中写一个UserAgentList列表
UserAgentList = [
'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1500.55 Safari/537.36',
'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_2) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1309.0 Safari/537.17'
]
在setting.py文件中启用DOWNLOADER_MIDDLEWARES,并且把默认的注释掉
DOWNLOADER_MIDDLEWARES = {
#'amazon.middlewares.MyCustomDownloaderMiddleware': 543,
'amazon.middlewares.MyUserAgentMiddleware': 543,
}
在middlewares.py文件中增加以下代码:
rom scrapy.downloadermiddlewares.useragent import UserAgentMiddleware
from amazon.settings import UserAgentList
import random
class MyUserAgentMiddleware(UserAgentMiddleware):
def __init__(self, user_agent=''):
self.user_agent = user_agent
def process_request(self, request, spider):
agent = random.choice(list(UserAgentList))
request.headers['User-Agent'] = agent
1.2.2 利用fake-useragent库设置User-Agent方法
安装fake-useragent库(useragent的库)
pip install fake-useragent
在middlewares.py文件中导入fake-useragent库
from fake_useragent import UserAgent
在middlewares.py文件中编写一个middleware中间件,
from fake_useragent import UserAgent
from scrapy.downloadermiddlewares.useragent import UserAgentMiddleware
class MyUserAgentMiddleware(UserAgentMiddleware):
def __init__(self, user_agent=''):
self.user_agent = user_agent
def process_request(self, request, spider):
ua = UserAgent()
request.headers['User-Agent'] = ua.random
在setting.py文件中启用DOWNLOADER_MIDDLEWARES,并且把默认的注释掉
DOWNLOADER_MIDDLEWARES = {
#'amazon.middlewares.MyCustomDownloaderMiddleware': 543,
'amazon.middlewares.MyUserAgentMiddleware': 543,
}
文件
方法
代码
注释
中加
中间件
从中
内容
写法
参数
变量
字体
第三方
蓝色
中导
中设
中通
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
宝山区会计数据库系统业务流程
用网络安全工程师证可以做什么
上海嵌入式软件开发周期
自动跟圈软件开发
厦门添远网络技术有限公司
通过数据库获取关闭按钮
惠州电商软件开发服务费
信息化软件开发程序
道闸系统数据库建立
小程秄网站软件开发
关于网络安全优秀征文500字
国家第一届网络安全周
易宝网络技术 怎么样
论文多久可以录入网络数据库
数据库装修图片
用软件开发热交换器
无锡自动软件开发简介
南昌纯真软件开发
英特尔磁盘管理服务器
网络安全班会收获
平板点菜软件开发
比利时服务器
怎么把文章从知网数据库删除
mysqli 操作数据库
计算机网络技术大学排名
手机版神奇宝贝服务器怎么找神兽
杭州恩牛网络技术有限公司主页
数据库装修图片
软件开发ajax
走步软件开发