5187 lionsoul 1578914315
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene,solr和elasticsearch的搜索分词接口
4个月前 6 issues
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包
5年多前 4 issues
5187 lionsoul 1578914315
Friso 是使用 c 语言开发的一款开源的高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中, 例如:MySQL,PHP,并且提供了php5, php7, ocaml, lua的插件实现
4个月前
结巴中文分词做最好的Python分词组件
7年前
436788 rockyzheng 1578923827
中文处理工具包,可能不是最快的开源中文分词,但很可能是最准的开源中文分词
5个月前 1 issue
Jiagu深度学习自然语言处理工具 知识图谱关系抽取 中文分词 词性标注 命名实体识别 情感分析 新词发现 关键词 文本摘要
7个月前 1 issue
基于HanLP自然语言处理包的elasticsearch分词器
2年多前
Go 语言高效分词, 支持英文、中文、日文等 词典用双数组trie(Double-Array Trie)实现, 分词器算法为基于词频的最短路径加动态规划。 支持普通和搜索引擎两种分词模式,支持用户词典、词性标注,可运行JSON RPC服务。
1个月前
VicWord 一个纯php的分词
3个月前
kcws 是一个基于深度学习的分词系统和语料项目。 Deep Learning Chinese Word Segment
接近3年前
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
接近3年前
59466 lizhengxian 1578915844
模仿锤子M1新出的BigBang功能,轻松分词,重新造句,基于讯飞分词SDK实现
3年多前
7122 ysc 1578914462
Java中文分词组件 - word分词。本站是word分词在Github的镜像站点,仅做备份使用。
接近2年前

Help Search