python爬取豆瓣电影TOP250数据的代码怎么写
发表于:2025-11-08 作者:千家信息网编辑
千家信息网最后更新 2025年11月08日,今天小编给大家分享一下python爬取豆瓣电影TOP250数据的代码怎么写的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后
千家信息网最后更新 2025年11月08日python爬取豆瓣电影TOP250数据的代码怎么写
今天小编给大家分享一下python爬取豆瓣电影TOP250数据的代码怎么写的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。
在执行程序前,先在MySQL中创建一个数据库"pachong"。
import pymysqlimport requestsimport re#获取资源并下载def resp(listURL): #连接数据库 conn = pymysql.connect( host = '127.0.0.1', port = 3306, user = 'root', password = '******', #数据库密码请根据自身实际密码输入 database = 'pachong', charset = 'utf8' ) #创建数据库游标 cursor = conn.cursor() #创建列表t_movieTOP250(执行sql语句) cursor.execute('create table t_movieTOP250(id INT PRIMARY KEY auto_increment NOT NULL ,movieName VARCHAR(20) NOT NULL ,pictrue_address VARCHAR(100))') try: # 爬取数据 for urlPath in listURL: # 获取网页源代码 response = requests.get(urlPath) html = response.text # 正则表达式 namePat = r'alt="(.*?)" src=' imgPat = r'src="https://atts.yisu.com/attachments/(.*?)" class=' # 匹配正则(排名【用数据库中id代替,自动生成及排序】、电影名、电影海报(图片地址)) res2 = re.compile(namePat) res3 = re.compile(imgPat) textList2 = res2.findall(html) textList3 = res3.findall(html) # 遍历列表中元素,并将数据存入数据库 for i in range(len(textList3)): cursor.execute('insert into t_movieTOP250(movieName,pictrue_address) VALUES("%s","%s")' % (textList2[i],textList3[i])) #从游标中获取结果 cursor.fetchall() #提交结果 conn.commit() print("结果已提交") except Exception as e: #数据回滚 conn.rollback() print("数据已回滚") #关闭数据库 conn.close()#top250所有网页网址def page(url): urlList = [] for i in range(10): num = str(25*i) pagePat = r'?start=' + num + '&filter=' urL = url+pagePat urlList.append(urL) return urlListif __name__ == '__main__': url = r"https://movie.douban.com/top250" listURL = page(url) resp(listURL)以上就是"python爬取豆瓣电影TOP250数据的代码怎么写"这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注行业资讯频道。
数据
数据库
电影
知识
篇文章
结果
代码
豆瓣
内容
密码
正则
游标
网页
不同
很大
元素
图片
地址
大部分
实际
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
腾讯云上服务器只有一个网卡
云端学习网络安全测试题
iphone备份服务器
深圳恒生互联网科技
河南工业服务器机箱怎么用云空间
小班关于网络安全知识竞赛
创建mc服务器地址
辽宁网络电视时间服务器异常
计算机网络技术安全运维方向
武汉一点橙互联网科技有限公司
在数据库怎么查看登录密码
工程管理审批管控软件开发平台
校园服务器维修视频
数据库与c 的连接数据库
sql数据库教程 pdf
上海拙赢互联网科技有限公司
台湾科学期刊数据库
美国服务器公司 中国区总部深圳
中群网络安全审计系统怎么安装
sql数据库建立学生登记表
台州定制软件开发质量
app社交软件开发
ad域服务器密码忘了
网络安全即全球公域
评价软件开发时间
网络技术公司的管理架构
旅游绘画软件开发
在网络安全的概念里
iot服务器
戴尔最新服务器