5187 lionsoul 1578914315
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene、solr、elasticsearch、opensearch的搜索分词接口
Java
8个月前
12 mirrors 1578989292
2
The IK Analysis plugin integrates Lucene IK analyzer (http://code.google.com/p/ik-analyzer/) into opensearch, support customized dictionary.
Java
2年多前
12837797 ohos rs 1712458884
0
5个月前
11
基于中文基础词库,并结合自定义词库进行分词的系统。 词库将持续进行更新,但2023年起语义理解为新研究方向。
PHP
2年前
0
IK分词器,主要针对lucene进行支持,版本与lucene版本同步
Java
1年多前
5187 lionsoul 1578914315
36
elasticsearch便捷版本,集成了一些常用的插件
Java
4年多前
61
Surfing-Segment是一个先进的文本分词工具,专门增强ik-analyzer。包含多个自定义词典,动态识别型号、同义词功能、elasticsearch插件等功能。显著的增强了对专业术语及复杂型号的分词精确度。是电商平台优化体验的理想选择。
Java
3个月前
12 mirrors 1578989292
5
Prose 是一款用于Go 语言的文本处理库(主要是英文),支持 okenization(标记化)、part-of-speech tagging(词性标注)、named-entit
1
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
2年多前
12 mirrors 1578989292
13
CoreNLP 是斯坦福提供的一组用Java编写的自然语言分析工具
12 mirrors 1578989292
7
首先感谢jieba分词原作者fxsjy,没有他的无私贡献,我们也不会结识到结巴 分词,更不会有现在的java版本
Java
3年多前
12 mirrors 1578989292
27
中文词法分析(LAC) 中文分词(Word Segmentation)是将连续的自然语言文本,切分出具有语义合理性和完整性的词汇序列的过程
C++
3年多前
812591 tenlee 1578933525
7
可能是东半球hao用的elasticsearch(es)中文分词器插件
Java
12个月前
1734999 mr xiaolong 1578958819
3
MMSegmentation 是一个基于 PyTorch 的语义分割开源工具箱。它是 OpenMMLab 项目的一部分
1年前
1229504 netmmmm 1615702617
0
C#
3年前

搜索帮助