如何使用R-wordcloud2包绘制词云
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,小编给大家分享一下如何使用R-wordcloud2包绘制词云,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!一 数据准备载入
千家信息网最后更新 2025年12月02日如何使用R-wordcloud2包绘制词云
小编给大家分享一下如何使用R-wordcloud2包绘制词云,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!
一 数据准备
载入所需的R包,准备好流浪地球的txt格式的文本文件。
library(jiebaRD) library(jiebaR) library(wordcloud2)
二 分词,统计词频
使用jieba包对文本进行分词。
engine = worker() segment("流浪地球.txt",engine)data <- scan('流浪地球.segment.2019-04-09_22_36_54.txt',sep='\n',what='',encoding="UTF-8") data2 <- freq(data)data2 <- qseg[data]data.words <- data2head(data.words)三 去掉停词
过滤掉类似"的","你","我们"等类似的无意义的停词,并可根据自己需要设置词频的个数。
#过滤掉1个字的词data.words <- subset(data.words, nchar(as.character(data.words))>1) #过滤停词stop=read.table(file=file.choose(),colClasses="character") stopwords=c(NULL) for(i in 1:dim(stop)[1]){ stopwords=c(stopwords,stop[i,1]) }for(j in 1:length(stopwords)){ data.words <- subset(data.words,data.words!=stopwords[j]) }四 统计词频
4.1 统计词频
data.freq <- table(unlist(data.words)) data.freq <- rev(sort(data.freq)) data.freq <- data.frame(word=names(data.freq), freq=data.freq)
4.2 根据需要过滤频次
#按词频过滤词,过滤掉只出现过一次的词,这里可以根据需要调整过滤的词频数data.freq=subset(data.freq, data.freq$freq.Freq>=2) head(data.freq) word freq.Var1 freq.Freq1 地球 地球 1642 太阳 太阳 953 发动机 发动机 604 人类 人类 355 地面 地面 306 木星 木星 28
五 绘制词云
5.1 图形设定为"star"
wordcloud2(data.freq[,2:3],color = "random-light", backgroundColor = "grey",shape = 'star')
5.2 汉字图形展示
letterCloud(data.freq[,2:3],word="地球",size = 2)
5.3 指定图形
指定的背景图需要在R包的example文件夹中,本例为微信的开机图,然而不像,,,鬼知道咋回事啊。
world = system.file("examples/download1.jpg",package = "wordcloud2")wordcloud2(data.freq[,2:3], figPath = world, size = 1,color = "black")OK,词云绘制完毕。
以上是"如何使用R-wordcloud2包绘制词云"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!
地球
词频
图形
篇文章
流浪
统计
人类
内容
发动机
地面
太阳
文件
文本
木星
准备
不怎么
个数
回事
大部分
数据
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
服务器管理员微信
sqlite 压缩数据库
国外网络安全危机
西安微梦创科网络技术
我的世界虎牙服务器pvp兑换码
前端和数据库哪个好
安恒招聘网络安全工程师
新网络技术论坛
网络技术服务推荐
电脑数据库软件打不开
外卖平台需要的数据库表
辽宁先进软件开发特征
手机连接服务器超时要怎么解决
敏捷软件开发知乎
幕义互联网科技
南开区高科技软件开发服务价钱
模拟腹腔镜软件开发
点击安装数据库没有反应
变电站网络安全演练方案
利用数据库及sql语言
网络安全宣传语学校
服务器管理员微信
hfss服务器显卡
奇游棋牌游戏软件开发
银行数据库顾客和账号
滁州点餐系统软件开发
组态王自带数据库么
北京特种网络技术分类设计
深圳停车系统软件开发
打印机服务器属性