Synonyms开源中文近义词工具包联合创作 · 2023-09-26 04:29Synonyms 是一个中文近义词工具包,它可用于如文本对齐、推荐算法、相似度计算、语义偏移、关键字提取、概念提取、自动摘要、搜索引擎等很多自然语言理解(NLP)任务。该工具包目前能搜索近义词和比较语句相似度等任务,且词汇量达到了 125,792。 该中文近义词工具包采用的基本技术是 Word2vec。 运行效果 浏览 5点赞 评论 收藏 分享 手机扫一扫分享 编辑 分享 举报 评论图片表情视频评价全部评论推荐 Synonyms开源中文近义词工具包Synonyms是一个中文近义词工具包,它可用于如文本对齐、推荐算法、相似度计算、语义偏移、关键字提取、概念提取、自动摘要、搜索引擎等很多自然语言理解(NLP)任务。该工具包目前能搜索近义词和比较语句SynonymsSynonyms0SynonymsSynonyms0FoolNLTK中文处理工具包FoolNLTK中文处理工具包特点可能不是最快的开源中文分词,但很可能是最准的开源中文分词基于BiLSTM模型训练而成包含分词,词性标注,实体识别,都有比较高的准确率用户自定义词典Installpippkuseg中文分词工具包pkuseg-python:一个高准确度的中文分词工具包pkuseg-python简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率。主要亮点pkuseg是由北京大学语言计算与机器学smallseg中文分词工具包smallseg--开源的,基于DFA的轻量级的中文分词工具包特点:可自定义词典、切割后返回登录词列表和未登录词列表、有一定的新词识别能力。Python示例代码:s3=file("text.txt")FoolNLTK中文处理工具包FoolNLTK中文处理工具包特点可能不是最快的开源中文分词,但很可能是最准的开源中文分词基于BiLsmallseg中文分词工具包smallseg -- 开源的,基于DFA的轻量级的中文分词工具包 特点:可自定义词典、切割后返回登pkuseg中文分词工具包pkuseg-python:一个高准确度的中文分词工具包pkuseg-python 简单易用,支持多FudanNLP中文自然语言处理工具包FudanNLP主要是为中文自然语言处理而开发的工具包,也包含为实现这些任务的机器学习算法和数据集。点赞 评论 收藏 分享 手机扫一扫分享 编辑 分享 举报