Benchmark Email认领

0粉丝

品牌信息

Benchmark Email

一站式邮件营销软件提供商

时光轴

里程碑1

LOG1

2024

03-27

轻识收录

打卡

评价

0.0（满分 10 分）0 个评分

什么是点评分

图片

表情

全部评价( 0)

推荐率 100%

推荐

中国信通院启动“可信AI”AI Safety Benchmark大模型幻觉评测

3月19日，为深入了解大模型的幻觉问题现状并推动其应用落地，中国信息通信研究院人工智能所基于前期的AI Safety Benchmark测评工作，正式发起大模型幻觉测试。本轮测试以大语言模型为对象，涵盖事实性幻觉和忠实性幻觉两种类型，测试数据包含7000余条中文样本，题型包括信息抽取、知识推理及事实判别等。