千家信息网

基于hanlp的es分词插件hanlp for elasticsearch怎么用

发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,基于hanlp的es分词插件hanlp for elasticsearch怎么用,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。elast
千家信息网最后更新 2025年12月03日基于hanlp的es分词插件hanlp for elasticsearch怎么用

基于hanlp的es分词插件hanlp for elasticsearch怎么用,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

elasticsearch-analysis-hanlp插件地址:https://github.com/pengcong90/elasticsearch-analysis-hanlp

Elasticsearch

默认分词

输出:

IK:

输出:

hanlp:

输出:

ik分词没有根据句子的含义来分词,hanlp能根据语义正确的切分出词

安装步骤: 1、进入https://github.com/pengcong90/elasticsearch-analysis-hanlp,下载插件并解压到es的plugins目录下,修改analysis-hanlp目录下的hanlp.properties文件,修改root的属性,值为analysis-hanlp下的data 目录的地址

2、修改es config目录下的jvm.options文件,最后一行添加

-Djava.security.policy=../plugins/analysis-hanlp/plugin-security.policy

重启es

GET /_analyze?analyzer=hanlp-index&pretty=true { "text":"张柏芝士蛋糕店" } 测试是否安装成功

analyzer有hanlp-index(索引模式)和hanlp-smart(智能模式)

自定义词典:

修改plugins/analysis-hanlp/data/dictionary/custom下的 我的词典.txt文件

格式遵从[单词] [词性A] [A的频次]

修改完后删除同目录下的CustomDictionary.txt.bin文件

重启es服务

目前仅支持5.x版本

注意在mac下5.5.1版本的es中,要删除plugins中.DS_Store隐藏文件,否则启动会报错

看完上述内容,你们掌握基于hanlp的es分词插件hanlp for elasticsearch怎么用的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注行业资讯频道,感谢各位的阅读!

文件 目录 插件 输出 内容 地址 方法 更多 模式 版本 词典 问题 成功 束手无策 为此 一行 单词 原因 句子 含义 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 u盘服务器安装系统教程 数据库建库建表命令语句 局网络安全事件应急预案 迅瑞网络技术有限公司 战地5退出服务器后卡死 数据库标签初始化 中国互联网属于科技吗 通榆软件开发技术在线咨询 电子科技大学互联网金融专业咋样 微微一笑倾城糜烂了服务器 远程登录服务器安全吗 军队数据库职工最新改革 江门塑胶模具erp软件开发 黑龙江软件开发系统研发 杭州同欣网络技术有限公司建筑 美世科技与互联网 数据库死锁原因及办法 网络安全主题手抄报和图教程 北京万方数据库 db2数据库 存储过程 关于网络技术社会实践报告 软件开发产能指标 数据库bw指什么 上海光雨网络技术有限公司 班级网络安全团日活动总结 迎国庆70周年网络安全 网络营销与网络安全 嘟嘟网络技术有限公司是干什么的 山东省联想服务器总代理零售 宏图三胞软件开发员工工资
0