@gitclebeg
大数据、数据分析、机器学习狂热爱好者,就职于一线互联网
go语言实现的海量在线用户聊天工具
用Java掌握所有算法与数据结构
PyTorch深度学习实战
谢慧志创建的项目
nlp项目基础框架:爬虫,针对动态网页(JS)的专有爬虫
自然语言深度学习框架
自然语言分词模块,为中文语料批量分词,会继承各种分词工具
solr中文分词插件,jieba-solr
利用 solr 建立搜索引擎,整合数据库以及本地文本文件。
通过nlp中的互信息以及左右信息,提取文本重要短语,最后存放到Solr中建立索引。