简介
专门针对中文文档的simhash算法库简介此项目用来对中文文档计算出对应的 simhash 值。 simhash 是谷歌用来进行文本去重的算法,现在广泛应用在文本处理中。详见SimhashBlog特性 使用 CppJieba 作为分词器和关键词抽取器 使用 jenkins 作为 hash 函数 hp... 更多
其它信息
地区
国产
开发语言
C/C++
开源组织
无
所属分类
神经网络/人工智能、 自然语言处理
授权协议
MIT
操作系统
Linux
收录时间
2023-09-25
软件类型
开源软件
适用人群
未知
评价
0.0(满分 10 分)0 个评分
什么是点评分
全部评价(
0)
推荐率
100%