基于hanlp的es分词插件
发表于:2025-12-01 作者:千家信息网编辑
千家信息网最后更新 2025年12月01日,摘要: elasticsearch是使用比较广泛的分布式搜索引擎,es提供了一个的单字分词工具,还有一个分词插件ik使用比较广泛,hanlp是一个自然语言处理包,能更好的根据上下文的语义,人名,地名,
千家信息网最后更新 2025年12月01日基于hanlp的es分词插件
摘要: elasticsearch是使用比较广泛的分布式搜索引擎,es提供了一个的单字分词工具,还有一个分词插件ik使用比较广泛,hanlp是一个自然语言处理包,能更好的根据上下文的语义,人名,地名,组织机构名等来切分词
Elasticsearch
默认分词

输出:
IK分词
输出:
hanlp分词
输出:
ik分词没有根据句子的含义来分词,hanlp能根据语义正确的切分出词
安装步骤:
1、进入https://github.com/pengcong90/elasticsearch-analysis-hanlp,下载插件并解压到es的plugins目录下,修改analysis-hanlp目录下的hanlp.properties文件,修改root的属性,值为analysis-hanlp下的data
目录的地址
2、修改es config目录下的jvm.options文件,最后一行添加
-Djava.security.policy=../plugins/analysis-hanlp/plugin-security.policy
重启 es
GET /_analyze?analyzer=hanlp-index&pretty=true
{
"text":"张柏芝士蛋糕店"
}
测试是否安装成功
analyzer有hanlp-index(索引模式)和hanlp-smart(智能模式)
自定义词典
修改 plugins/analysis-hanlp/data/dictionary/custom下的 我的词典.txt文件
格式遵从 [单词] [词性A] [A的频次]
修改完后删除同目录下的 CustomDictionary.txt.bin文件
重启 es服务
目录
文件
输出
插件
模式
词典
语义
成功
一行
上下
上下文
人名
分布式
单字
单词
句子
含义
地名
地址
属性
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
什么叫人工智能网络安全
计算机网络技术吴功宜
gi数据库
网络安全工程师认证培训
中国网络安全响应中心
软件开发测试就业前景
怎样选择数据库设计
数据库文件种类
数据库中男女怎么设置列表
长春智能网络技术诚信合作
利好政策促网络安全
吉林仓储生鲜软件开发
所有数据库
深圳爱生活网络技术有限公司
jsp中查询数据库
数据库具有最小冗余度较高的程序
华众网络安全
厦门网络安全龙头
税控服务器管理系统提示下载控件
如何应对常见的网络安全事故
gi数据库
广州番禺小程序软件开发公司
哪种服务器不能用公网ip
国家网络安全发布
德勤拥有完整的网络安全服务能力
软件开发公司有补贴
网络安全产业的地位与作用
四川浪潮服务器虚拟化哪家好
海南小型服务器
车载网络技术的目的