搜索
word分词Java分布式中文分词组件
认领
关注
0
粉丝
word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时
知识
简介
word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。能通过自定义配置文件来改变组件行为,能自定义用户词库、自动检测词库变化、支持大规模分布式环境,能灵...
更多
其它信息
地区
国产
开发语言
Java
开源组织
无
所属分类
程序开发、 中文分词库
授权协议
GPL
操作系统
跨平台
收录时间
2023-09-29
软件类型
开源软件
适用人群
未知
时光轴
里程碑
1
LOG
0
2023
2023-09
轻识收录
打卡
我要打卡
我要打卡
评价
0.0
(满分 10 分)
0 个评分
什么是点评分
图片
表情
视频
评价
全部评价( 0)
推荐率 100%
推荐
word分词Java分布式中文分词组件
word分词是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram
jiebaPython中文分词组件
jieba"结巴"中文分词:做最好的Python中文分词组件"Jieba" Feature支持三种分词模式:精确模式,试图将句子最精确地切开,适合文本分析;全模式,把句子中所有的可以成词的词语都扫描出
CWSharp.NET 中文分词组件
CWSharp 是 .Net 的中文分词组件,支持中英文或者混合词组,提供自定义词典功能,支持Luc
jiebaPython中文分词组件
jieba"结巴"中文分词:做最好的Python中文分词组件 "Jieba" Feature支持三种
CWSharp.NET 中文分词组件
CWSharp是.Net的中文分词组件,支持中英文或者混合词组,提供自定义词典功能,支持Lucene.Net。特性支持多种分词器StandardTokenizerBigramTokenizerStop
scsegPython中文分词
scseg中文分词,是基于mmseg的简单分词组件Feature支持pinyin分词支持用户自定义词
genius中文分词
GeniusGenius是一个开源的python中文分词组件,采用CRF(ConditionalRandomField)条件随机场算法。Feature支持python2.x、python3.x以及py
Ansj中文分词
Ansj中文分词这是一个ictclas的java实现.基本上重写了所有的数据结构和算法.词典是用的开
SegoGo 中文分词
词典用双数组trie(Double-Array Trie)实现, 分词器算法为基于词频的最短路径加动
Ansj中文分词
Ansj中文分词这是一个ictclas的java实现.基本上重写了所有的数据结构和算法.词典是用的开源版的ictclas所提供的.并且进行了部分的人工优化内存中中文分词每秒钟大约100万字(速度上已经