Python词频统计的方法有哪些
发表于:2025-11-09 作者:千家信息网编辑
千家信息网最后更新 2025年11月09日,这篇文章将为大家详细讲解有关Python词频统计的方法有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。统计文件里每个单词的个数思路:分别统计文档中的单词,与出现
千家信息网最后更新 2025年11月09日Python词频统计的方法有哪些
这篇文章将为大家详细讲解有关Python词频统计的方法有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
统计文件里每个单词的个数
思路:
分别统计文档中的单词,与出现的次数
用两个列表将其保存起来,最后再用zip()函数连接输出**
想法成立开始实践
方法一:
# 导入文件with open("passage.txt", 'r') as file: dates = file.readlines()# 处理words = []for i in dates: words += i.replace("\n", "").split(" ") # 用空字符来代替换行 words +是为了不被覆盖无+将只有最后一条数据 # print(i.replace("\n","").split(" "))setWords = list(set(words)) # 集合自动去重num = [] # 统计一个单词出现的次数for k in setWords: count = 0 for j in words: if k == j: count = count + 1 num.append(count)print(num)print(setWords)# 输出for x, y in zip(setWords, num): # 将两个列表用zip结合 print(x + ":" + str(y))、效果图:

方法二:
此方法用来字典,较前一个相对简洁一点
# 导入with open("passage.txt", 'r') as file: dates = file.readlines()# 处理words = []for i in dates: words += i.replace("\n", "").split(" ") # print(i.replace("\n","").split(" "))# setWords=list(set(words)) #可以不用这个print(words)print("-" * 40)# print(setWords)diccount = dict()for i in words: if (i not in diccount): diccount[i] = 1 # 第一遍字典为空 赋值相当于 i=1,i为words里的单词 # print(diccount) else: diccount[i] = diccount[i] + 1 # 等不在里面的全部遍历一遍赋值就都在里面了,我们再来记数print(diccount)效果图:

统计的文档
关于"Python词频统计的方法有哪些"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
统计
方法
单词
篇文章
词频
两个
字典
效果
效果图
文件
文档
更多
次数
处理
输出
不错
实用
简洁
不用
个数
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网站建设与数据库管理
无源光网络技术应用大作业
it行业的硬件与软件开发
混沌实验 数据库
网络安全使用常识
淮安浪潮服务器厂家
数据库定义表结构
财务数据网络安全重要性
软件开发外包体验
女生适合什么软件开发
计算机网络技术学生面试
b站的服务器有不间断电源
portal视频服务器
服务器远程操作管理工具
无尽战区服务器
互联网科技类媒体有哪些
猎杀对决各个服务器的特点
数据库查询删除
重庆软件开发解决方案服务
我的世界服务器怎么当副管理员
网络安全策略系统
包头市 网络安全
安庆电力软件开发定制公司
后端怎么控制数据库
魏祖宽数据库新技术
2020郑州市网络安全会议
我的世界群服务器
网络安全具备的特征包括
数据库考勤表设计
网络安全主要面临的威胁