导航：首页 > 互联网科技 >

怎么用python爬取猫眼电影的前100部影片

发表于：2025-12-06 作者：千家信息网编辑

千家信息网最后更新 2025年12月06日，这篇文章主要介绍"怎么用python爬取猫眼电影的前100部影片"，在日常操作中，相信很多人在怎么用python爬取猫眼电影的前100部影片问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法

千家信息网最后更新 2025年12月06日怎么用python爬取猫眼电影的前100部影片

这篇文章主要介绍"怎么用python爬取猫眼电影的前100部影片"，在日常操作中，相信很多人在怎么用python爬取猫眼电影的前100部影片问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答"怎么用python爬取猫眼电影的前100部影片"的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

import requestsimport refrom bs4 import BeautifulSoupfrom lxml import etreeimport tracebackimport csv#定义一个函数获取豆瓣电影第一页def get_one_page(url,code = 'utf-8'):    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.90 Safari/537.36'}    try:        r = requests.get(url,headers = headers)        if r.status_code == 200:            r.encoding = code            return r.text        else:            print("相应失败")            return None    except:        traceback.print_exc()def process(raw):    right = raw.split("@")    return right[0]def area(a):    if a[-1] == ")":        return a[16:]    else:        return None
def parse_one_page(slst,html):    #正则表达式    # rank = re.findall('.*?',html,re.S)    # name = re.findall('(.*?)',html,re.S)    # star = re.findall('
(.*?)
',html,re.S)    # time = re.findall('(.*?)
',html,re.S)    # print(time)    #正则表达式别忘了加上r,防止转义,否则会报错    # 把上面的正则表达式合在一起    pattern = re.compile(r'
.*?.*?(.*?).*?
(.*?)
.*?(.*?)
.*?<.*?>(.*?)(.*?)
',re.S)    items = re.findall(pattern,html)    #print(items)    for item in items:        #yield就相当于return的功能，但也有所不同，yield语句把程序编程迭代器        yield {            'rank':item[0],            'img':process(item[1]),            'MovieName':item[2],            "star":item[3].strip()[3:],            "time":item[4].strip()[5:15],            "area":area(item[4].strip()),            "score":str(item[5]) + str(item[6])        }    # return ""def write_to_file(item):    with open("猫眼top100.csv",'a',encoding = "utf_8_sig",newline="") as f:        #a追加模式 newline区分换行符        fieldnames = ['rank','img','MovieName','star','time','area','score']        w = csv.DictWriter(f,fieldnames = fieldnames)  #字典写入到csv        # w.writeheader()        w.writerow(item)     return ""def down_img(name,url,num):    try:        response = requests.get(url)        with open('C:/Users/HUAWEI/Desktop/py/爬虫/douban/'+name+'.jpg','wb') as f:            f.write(response.content)            print("第%s张图片下载完毕"%str(num))            print("="*20)    except Exception as e:        print(e.__class__.__name__) #打印错误类型名称def main(i):    num = 0    url = 'https://maoyan.com/board/4?offset=' + str(i)    html = get_one_page(url)    #print(html)    lst = [] #这个在这里没啥用，但以后若要单独存储某类信息，可是这样写，后面再对应加上函数参数    iterator = parse_one_page(lst,html)    for a in iterator:        #print(a)        num += 1        write_to_file(a)        down_img(a['MovieName'],a['img'],num)                # if __name__ == '__main__':#     for i in range(10):#         main(i)        #多线程抓取 from multiprocessing import Poolif __name__ == '__main__':    pool = Pool()    pool.map(main,[i * 10 for i in range(10)])

最终运行结果如下：

保存封面图片

把爬到的信息储存到csv文件中

到此，关于"怎么用python爬取猫眼电影的前100部影片"的学习就结束了，希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习，快去试试吧！若想继续学习更多相关知识，请继续关注网站，小编会继续努力为大家带来更多实用的文章！

很赞哦！

猫眼电影影片学习正则表达式函数图片更多帮助不同实用接下来功能参数名称图片下载字典封面换行符数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全电脑网络安全解决方案路由器服务器拒绝接入安徽软件开发企业名录服务器连接的cost值在哪里看网络安全信息小组三明网络安全作业广州新华互联网科技学校校长我的世界服务器秘籍舟山学软件开发设计态势感知系统所包含的服务器软件开发在哪个大学学习好遏制重大安全隐患数据库嵌入式系统开发跟软件开发三级网络技术视频下载有关的网络安全实验浪潮服务器与交换机连接方法高级数据库教材哪一本好广州追梦空间互联网科技有限公司求购海康服务器数据库int后面的括号倩女幽魂网游服务器上海动盟网络技术有限公司泰州应用软件开发培训网络安全国际资格认证 seo对网站服务器网络要求浪潮服务器更换同型号主板禅城软件开发培训有哪些成都企成云商网络技术有限公司使用ssh管理远程服务器读智能网络技术好吗

扫描关注千家信息网微信公众号，第一时间获取内容更新动态

转载请说明来源于"千家信息网"

本文地址：https://www.qianjiagd.com/a2283

上一篇
iOS系统修复软件Joyoshare UltFix for Mac怎么用

这篇文章给大家分享的是有关iOS系统修复软件Joyoshare UltFix for Mac怎么用的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。Joyoshare UltF

下一篇
如何理解Apache解压版注册为windows服务的方法

本篇文章给大家分享的是有关如何理解Apache解压版注册为windows服务的方法，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话不多说，跟着小编一起来看看吧。1、Ap

相关文章

搭建zoopker+hbase 环境

版本控制系统（git + gitolite）

【新梦想老师分享】分布式锁的正确"姿势"

如何搭建母婴社区

spring通过profile实现开发和测试环境切换

最新2.7版本丨DataPipeline数据融合产品最新版本

串口调试助手，VB6.0开发

七、flink--异步IO

团队转型之痛之悟

Oracle 和 MySQL 的 JDBC 到底有多慢?

站长推荐

点击排行

recovery是什么意思?电脑开机重启显示recovery蓝屏怎么办

怎么在Linux中配置SSH和Xshell远程连接服务器

VS2008无法直接查看STL值怎么办

什么是RPC框架

.net mvc超过了最大请求长度怎么办

java怎么实现try/catch异常块

PHP中如何处理上传文件

php中require_once报错的解决方法

PHP如何编写学校网站上新生注册登陆程序

php中微信公众号开发模式的示例分析

在vmware esxi6.5中将硬盘驱动类型由HDD变为SSD类型

Vue中的匿名插槽与具名插槽是什么

vue3与vue2的区别以及vue3的API用法介绍

录制的横屏视频怎么变成全屏竖屏（录制的横屏怎么变竖屏）

qq群作业里为什么图片上传不了（qq群作业照片传不上去）

vscoder如何关闭错误提示

百度网盘PDF怎么转换成Word格式 PDF转Word操作教程

老年机号码拉黑怎么解除（老年机号码拉黑怎么解除）

京东以旧换新评估价和实际一样吗（京东以旧换新估价和成交价一样吗）

拼多多注销后可以重开新用户吗（拼多多注销后重开算新用户吗）

标签云

数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全数据库安全章节测试华大基因数据库安全性数据库es安全性测试工具数据库与云安全微生物安全数据库数据库个人信息安全吗安全数据库降级黑龙江数据库安全防护系统数据库安全性实验例题在国家公共安全数据库有记录

猜你喜欢

微信登录加载联系人失败怎么弄（微信加载联系人失败点击重试）

华为手机按键震动在哪设置关掉按键振动怎么取消方法

陌陌无限注册教程（怎么注册陌陌新号）

微信看不到朋友圈不显示一条横线（微信看不到朋友圈只有一条横线）

win10开机蓝屏终止代码SYSTEM_SERVICE_EXCEPTION的解决方法

快影怎么把视频弄成横屏播放制作方法分享

VS2008无法直接查看STL值怎么办

支付宝双v会员的利弊（支付宝双v会员的利弊）

怎么将苹果手机中录音发给好友 iPhone传语音文件方法教程

拼多多的多多支付怎么解绑银行卡（拼多多的多多支付怎么解绑银行卡）