文本识别

Hotoday

共 1742字,需浏览 4分钟

 ·

2020-11-09 20:10

商品详情

商品亮点
  • 1.检测速度快2.准确性较高
商品说明
版本: V1.0 交付方式: API
适用于: 其他 上架日期: 2020-07-14
风险文本识别服务核心功能介绍:
输入一段文本,可检测并识别该文本中包含的涉黄、涉政、广告内容。

应用场景推荐:
用户信息、评论审核:对app注册的用户基本信息及用户发出评论进行机器审核及过滤、提升审核效率 

文本内容审核:对app内用户发布的文章内容进行机器检测,识别包含的风险文本,助力保障产品内容安全,辅助人工处理风险内容,同时提升人工审核效率,降低人力成本。

特色优势:
检测速度快、词库量级大、准确性较高
鉴黄:对文本中包含的色情、污秽等内容进行识别
涉政:对文本中的涉政人物、反动言论、敏感信息等内容进行识别
广告:对文本中夹带的有售卖意向的广告内容进行识别

风险文本识别服务接口说明:

1.请求参数说明:
字段名称 类型 必填 说明
text               string  YES    文本内容

2.返回参数说明:
字段名称 类型                说明
data       object      返回结果各个风险结果标识
data内容描述:
字段名称 类型 说明
ad              object    广告敏感词等级
ero              object   色情敏感词等级
sen              object   政治敏感词等级

返回码描述:
字段名称 返回码 说明
code          200  正常
code         404          异常,如超时、图片下载失败、解析异常等

文本分类服务功能介绍:
提供对文本按照内容类型进行分类并输出置信度,目前支持科技、美食、健康、娱乐等内容类型,可为文本分类、内容分析等应用提供基础技术支持。
应用场景推荐:
文章内容分类划分:对新闻资讯/文章按照内容分类进行划分,辅助垂类内容建设 。

个性化推荐:可使用文本分类服务对文章分类的计算结果,结合用户画像,对用户进行个性化推荐。
特色优势:

支持文本内容主题的一级分类和二级分类,目前首批 支持一级分类如健康、时尚、体育等数十余个一级分 类,以及如颈椎病、养生、时装搭配、户外运动、冰 雪运动等数十个二级分类。

置信度:文本分类服务输出文章的分类结果时,可同 时输出置信度分值,分值越高代表机器预测文章与该 分类结果相关度越高。
接口说明文档:

一.请求方式
post

二.参数说明

请求参数说明
字段名称 类型 必填 说明
text               string  YES    文本内容

返回参数说明
字段名称 类型 说明
data       object 返回结果各个分类结果

data内容描述
字段名称 类型 说明
数字     string      分类id
level    object    分类等级
weight    object    权重分数

返回码描述
字段名称 返回码 说明
code 200 正常
code 404 异常,如超时、图片下载失败、解析异常等


文本关键词提取服务核心功能介绍:
输入一段文本,该服务可对该文本内容进行分析,提取核心关键词,可应用于资讯个性化推荐等方向。
应用场景:
可利用机器辅助完成大量文章打标签工作,关键词提取结果应用于资讯个性化推荐等。
特色优势:
对文本内容进行深度分析,输出能够反映文章关键信息的主题、人物、场景、话题、实体等多维度关键字。

接口说明文档:

一.请求方式
post

二.参数说明

请求参数说明

字段名称 类型 必填 说明
text               string  YES       文本内容

返回描述

字段名称 类型 说明
tag                string 关键词
weight       double 该关键词的权重

请求示例:

 http://host/tagExtract

请求参数:

{"text":"小明逛街"}

返回示例:

{"code":200,"data":{"逛街":{"weight":1.0000000062070615}}}

用户案例

暂无,请等待更新
浏览 4
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报