如何使用selenium爬取表情包
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,本篇内容主要讲解"如何使用selenium爬取表情包",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"如何使用selenium爬取表情包"吧!https://
千家信息网最后更新 2025年12月02日如何使用selenium爬取表情包
本篇内容主要讲解"如何使用selenium爬取表情包",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"如何使用selenium爬取表情包"吧!
https://www.doutula.com/photo/list/?page=1

不过这个网站直接requests请求不到内容,应该也是js加载的。所以最简单的办法就是使用selenium,万能!
该网站的结构

如果是gif,会多出一个img标签
根据此来写出xpath,拿出图片的地址,使用urllib进行下载
下载完成后保存。然后在通过wxpy库,发送给好友或者群。
具体代码
使用selenium获取表情包,并保存到文件中。注意保存的时候文件名最好是英文或者数字,否则当你使用wxpy库模拟发送的时候,会直接报错。
def get_doutu():
browser = webdriver.Chrome()
# img_url_dic = {}
for i in range(1, 2):
browser.get('https://www.doutula.com/photo/list/?page=%s' % str(i))
time.sleep(4)
eles = browser.find_elements_by_xpath('//div[@class="container_"]/div[@id="pic-detail"]/div[@class="row"]/div[@class="col-sm-9"]/div[@class="random_picture"]/ul[@class="list-group"]/li[@class="list-group-item"]/div[@class="page-content text-center"]/div/a[@class="col-xs-6 col-sm-3"]/img[@data-original]')
# names = browser.find_elements_by_xpath('//div[@class="container_"]/div[@id="pic-detail"]/div[@class="row"]/div[@class="col-sm-9"]/div[@class="random_picture"]/ul[@class="list-group"]/li[@class="list-group-item"]/div[@class="page-content text-center"]/div/a[@class="col-xs-6 col-sm-3"]/img[@data-original]')
for j in range(len(eles)):
url = eles[j].get_attribute('data-original')
url = url.split('!')[0]
ext = url.split('.')[-1]
name = random.randrange(1, 10000, 2)
filename = str(name) + '.' + ext
# 保存图片数据
data = urllib.request.urlopen(url).read()
f = open('image/' + filename, 'wb')
f.write(data)
f.close()
time.sleep(5)
browser.close()
browser.quit()获取文件列表,打印是为了充数,将文件的地址拼接好,发送给send_news(),由它进行发送。
def listdir(file_dir):
for root, dirs, files in os.walk(file_dir):
print(root) # 当前目录路径
print(dirs) # 当前路径下所有子目录
print(files) # 当前路径下所有非目录子文件
print(type(files))
for i in files:
send_news(file_dir + i)
time.sleep(10)到入wxpy包,登录微信并发送
def login_wechat():
global bot
bot = Bot()
# bot = Bot(console_qr=2,cache_path="botoo.pkl")#linux环境上使用
def send_news(data):
if bot == None:
login_wechat()
try:
my_group = bot.groups().search(u'逗比四人行')[0]
time.sleep(20)
print(data)
my_group.send_image(data)
except Exception as e:
print(u"失败!!", e)
最好设置间隔时间。小心被清理。
到此,相信大家对"如何使用selenium爬取表情包"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
文件
表情
内容
网站
路径
图片
地址
时候
最好
目录
学习
实用
更深
代码
兴趣
办法
好友
子目
子目录
实用性
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络安全周2018专题
开服务器的好名字
多台服务器怎么部署一个项目
vivo嵌入式软件开发面试
网络安全初一
pg数据库怎么查锁
can软件开发计划
亚马逊数据库库存
网络安全书画图片
网络安全管理什么公安岗位
游戏软件开发设计公司
南充软件开发工作室
网络安全事件信息上报工作
宁波营销网络技术管理系统
软件开发的需求清单
git上传到服务器
湖北省网络安全大学
高速移动网络技术ppt
100个数据库面试题
python做网络安全
网络安全应事件的处置情况
深圳市旭昇互联网科技有限
互联网科技正装
数据库选择和投影有什么区别
支持软件开发的各个环节控制
所谓网络安全漏洞是指()
游戏软件开发设计公司
服务器硬盘热插拔报警恢复
金融科技 互联网
巢湖网络安全师