R语言jiebaR包文本中文分词及词云制作的示例分析
发表于:2025-12-01 作者:千家信息网编辑
千家信息网最后更新 2025年12月01日,R语言jiebaR包文本中文分词及词云制作的示例分析,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。微信出现之前,qq群是
千家信息网最后更新 2025年12月01日R语言jiebaR包文本中文分词及词云制作的示例分析
R语言jiebaR包文本中文分词及词云制作的示例分析,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。
微信出现之前,qq群是我和读者交流的主要阵地,一般我会问大家为什么入群这样一个问题,收集到一些有趣的回答,今天就以这组文本数据练习中文分词和词云图的制作。
首先我们先从excel读取数据
data <- read.xlsx("why.xlsx")data <- data[,1]准备jiebaR包和分词引擎
library(jiebaR)engine <- worker()
开始分词
fc <- segment(data,engine)
我们会发现分词质量不高,有些词语要剔除。
准备停止词stopwords.txt
t <- readLines('stopwords.txt')stopwords<-c(NULL)for(i in 1:length(t)){stopwords[i]<-t[i]}开始过滤
fc2 <- filter_segment(fc,stopwords)
过滤之后,我们发现此时的关键词更加凸显。
统计词频
freq <- sort(table(fc2),decreasing = T)
简单画个饼图看看效果咋样吧
pie(head(freq))
联想造句:爱好者想学习和交流数据分析和统计(这个意思非常符合入qq群目标)。
把关键词和词频转换为数据框结构
mydata=data.frame(word=names(freq),freq=as.vector(freq),stringsAsFactors= F)
制作一个词云图吧
library(wordcloud2)wordcloud2(mydata,size = 1.5)
这就是最终效果了,简单总结一下:入群最主要的目的是"学习""数据分析"以及"统计"了,ta们都有谁内?有"爱好者"、"新手"、"研究生",不管是"交流",或是"请教""咨询",总是是要"谢谢""数据小兵"(纯属娱乐造句)。
看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注行业资讯频道,感谢您对的支持。
数据
分析
制作
交流
学习
统计
文本
中文
云图
关键
关键词
效果
数据分析
新手
爱好者
词频
准备
帮助
示例
语言
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
软件开发的生命周期5个阶段
泰州公司网络安全准入控制报价
win7网络安全模式进不了
依法规范网络安全
核电厂辐照监督数据库
常见网络安全问题原因分析
苹果6sp无法连接服务器怎么办
中药数据库建设与应用
cmd数据库启动
网络安全法及标准总结
5g为什么会影响网络安全
网络安全大班图片
信息技术考试数据库管理优势
xml如何存入数据库
爱博网络技术
关于网络安全的微电影主题
数据库中如何呈现概念模式
网络安全技术命令删除论文
通信软件开发助理日记
备品备件管理数据库设计
企业网络安全最大威胁
医学临床数据库
阿里云腾讯云百度云服务器哪个好
盛大云免费服务器
网络安全培训哪里靠谱
英雄传说网络技术
数据库数据类型大全
网络安全法发布违法信息
无法访问远程服务器地址
深度智能网络技术自动答题入口