怎么用python爬取中国大学排名网站排名信息
发表于:2025-11-07 作者:千家信息网编辑
千家信息网最后更新 2025年11月07日,今天就跟大家聊聊有关怎么用python爬取中国大学排名网站排名信息,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。程序解决问题如下:利用pyth
千家信息网最后更新 2025年11月07日怎么用python爬取中国大学排名网站排名信息
今天就跟大家聊聊有关怎么用python爬取中国大学排名网站排名信息,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
程序解决问题如下:
利用python网络爬虫爬取中国大学排名网站上的排名信息,将排名前20的大学的信息保存为文本文件,并在窗口打印出这20所大学的信息,按列打印和保存。
程序代码如下:
import requestsfrom bs4 import BeautifulSoupimport bs4 def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except: return "" def fillUnivList(ulist, html): soup = BeautifulSoup(html, "html.parser") for tr in soup.find('tbody').children: if isinstance(tr, bs4.element.Tag): tds = tr('td') hdfd = tds[0].find('div') tt = hdfd.string.split() ff = "".join(tt) attr = tds[1].find('a') hh = tds[4].string.split() hg = "".join(hh) shf=tds[2].text.split() shfn="".join(shf) ulist.append([ff, attr.string,shfn,hg]) def printUnivList(ulist, num): tplt = "{0:^10}\t{1:{4}^10}\t{2:^10}\t{3:^10}" print(tplt.format("排名","学校名称","省份","总分", chr(12288))) with open('save.txt', 'w+', encoding='utf-8') as f: f.write(tplt.format("排名","学校名称","省份","总分", chr(12288))) f.write('\n') for i in range(num): u = ulist[i] print(tplt.format(u[0], u[1], u[2],u[3],chr(12288))) with open('save.txt', 'a', encoding='utf-8') as f: f.write(tplt.format(u[0], u[1], u[2],u[3],chr(12288))) f.write('\n') def main(): with open('save.txt', 'w+', encoding='utf-8') as f: f.write("排名,学校,省份,总分\n") f.close() uinfo = [] url = 'https://www.shanghairanking.cn/rankings/bcur/2021' html = getHTMLText(url) fillUnivList(uinfo, html) printUnivList(uinfo, 20)main()程序运行结果如下:
看完上述内容,你们对怎么用python爬取中国大学排名网站排名信息有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。
信息
大学
网站
中国
中国大学
内容
学校
总分
省份
程序
名称
代码
文件
文本
更多
爬虫
知识
篇文章
结果
网络
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
公共ftp服务器地址
淄博掌上网络技术有限公司
nginx多个服务器代理
索引对数据库系统影响
王者荣耀流畅的服务器好组队吗
中国人遗传数据库
vlan dhcp服务器
东营商城软件开发
正规软件开发厂家
葫芦岛网络安全活动
高中 网络技术 教案
网络安全坐标图片
网络安全应该学哪些
青岛大学数据库
办一期网络安全的手抄报
数据库 面试
服务器一般能用多久
魔兽世界内部数据库收不到钱
竹溪公司软件开发专业服务
事业单位退休人员数据库
做一个软件开发多少钱
黑龙江软件开发系统价目表
网络安全法制教育PPT
高青生产管理软件开发
房产中介的数据库逻辑结构表格
游戏软件开发助理做什么的
网络安全的关键及核心
网络安全故事征文600字
北京游戏软件开发学院
ourplay一直显示服务器错误