千家信息网

如何利用Python生成词云

发表于:2025-12-04 作者:千家信息网编辑
千家信息网最后更新 2025年12月04日,这篇文章主要介绍"如何利用Python生成词云",在日常操作中,相信很多人在如何利用Python生成词云问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"如何利用Pytho
千家信息网最后更新 2025年12月04日如何利用Python生成词云

这篇文章主要介绍"如何利用Python生成词云",在日常操作中,相信很多人在如何利用Python生成词云问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"如何利用Python生成词云"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

前言:

话说,在这个大数据时代,获取信息显得极为容易,可正是如此,我们想要对信息进行直观地了解难度就大了。

Excel是一个很好的数据可视化方法,不过有时候我们的数据来源可能并不是一张或者多张Excel表格,这样子的话如果我们想利用Excel进行数据可视化就显得不是那么容易。

首先我们需要逐个将数据导入到Excel中,然后再用Excel的图表对数据进行可视化分析。在信息量大的情况下,这么做显然得不偿失,我们只是想对数据进行一个直观的了解,为什么要搞得这么复杂呢?

以上的问题是很多人会遇到的,因此一些数据可视化方式便应运而生,例如词云。大家看看这张图片


是不是非常直观并且炫酷呢?

现在,想做出这样子的图片的小伙伴们,跟着我,我手把手教你们做出这样子的词云,这里的实现方法是使用Python中的相关库

安装方法如下

pip install matplotlibpip install numpypip install jieba

以上的三个命令的作用是分别安装:matplotlib,numpy以及jieba这三个库。当然有些同学可能已经安装过了。想要检验是否有安装,可以在命令行下输入

pip list

这样子即可显示你已经安装的库,如果没有全部出现上面的3个库,请在命令行下执行对应的命令并且等待安装成功。

如果你没有安装Python或者输入pip显示不是内部命令,请移步这篇文章

Python小白环境搭建-开箱即用

现在直接上代码,代码上面有注释,相信你一定能看懂

# worcloud是生成词云的关键import wordcloud# numpy是一个强大的科学计算库,我们将用它来把PIL库打开的图片保存为数组import numpy as np# PIL是一个图像处理库,用来打开图片from PIL import Image# jieba是中文分词库,可以智能地拆分词语import jieba# matplotlib库是一个绘图库,可以用来显示图片以及绘制多种图形import matplotlib.pyplot as plt
# 生成背景图片的两种方法## 注意背景图片的路径要写对,可以是完整路径,例如C:/image/test.jpg# 若图片与Python代码在同一个文件夹,那可以直接写图片名称+后缀,例如test.jpg# 1.使用 matplotlib库读取图片bg_1=plt.imread("background_image_1.jpg")
# 2.使用numpy库和PIL库,PIL库用于打开图片,numpy库用于将图片转化为数组# 下面这行代码我注释掉了# bg_2=np.array(Image.open('background_image_2.jpg'))
# 对于以上的图片选择,要特别注意图片的背景应该为白色

#配置词云的背景,图片,字体大小等参数,# 也可以不配置,直接 wc=wordcloud.WordCloud()wc=wordcloud.WordCloud( # font_path为字体文件的路径,如果没有这个,那么生成的词云图片无法显示中文 font_path="C:/Windows/Fonts/simfang.ttf",
# scale为按比例放大或者缩小生成的图片。例如1.5表示图片放大为原来的1.5倍,可省略 scale=1.5,
# mask表示背景图片,如果不没有背景图片,那这个可以省略 mask=bg_1,
# background_color为背景颜色,默认为黑色,可以省略 background_color="black",
# width为词云生成的图片宽度,默认为400 width=600,
# height为词云生成的图片高度,默认为200 height=400,
# max_words图片上显示的最大词语的个数 max_words=1000,
# max_font_size为最大字体的大小 max_font_size=120,
# min_font_size为最小字体大小,默认为4 min_font_size=4)
# 打开要生成词云的文件,一般是txt格式的纯文本文档with open('词云来源.txt','r',encoding="utf-8") as f:
# text=f.read()是说读取 词云来源.txt 这个文件的所有内容并存储到变量text中 text=f.read()
# 利用jieba库把text拆分并且使用空格分隔拆分后的结果 spilt_text=" ".join(jieba.lcut(text))
print("正在生成词云,预计时间35s......")
# 调用generate方法,传入要生成词云的文本
wc.generate(spilt_text)
# 把词云保存成图片wc.to_file('wordcloud.jpg')
print("生成完毕!")

背景图片


词云效果


到此,关于"如何利用Python生成词云"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!

图片 生成 数据 背景 方法 命令 背景图片 代码 字体 文件 样子 可视化 学习 直观 信息 大小 来源 路径 最大 三个 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 本科软件开发相关的专业 广西户外广告机软件开发 大学报专业可以报软件开发吗 成都锦庭网络技术有限公司 服务器可以直接放在家里用么 高中课本数据库管理技术 反编译软件开发公司推荐 魔兽世界永恒的终结哪个服务器好 广东服务器机柜供应商家 macbook数据库 剑灵南天国服务器 四川惠普服务器虚拟化定制云空间 查看数据库中所有权限 pc我的世界服务器怎么加材质包 吴忠网络安全工程师培训课程 服务器系统搭建使用教程 学计算机网络技术学费 乌镇互联网大会上的黑科技 左云有名的网络安全创新服务 关系数据库候选关键字例题 土地确权确大四至数据库字段 如何将dat文件导入数据库 大华服务器机柜导轨安装 国势下载软件开发 数据库库存管理流程 网络安全审计的功能 微信小程序数据库er图 怪物猎人ol华南服务器 衡阳网络安全普法 安全模式备份数据库
0