搜索
下载APP
Benchmark Email
认领
关注
0
粉丝
知识
品牌信息
Benchmark Email
一站式邮件营销软件提供商
时光轴
里程碑
1
LOG
1
2024
03-27
轻识收录
打卡
我要打卡
我要打卡
评价
0.0
(满分 10 分)
0 个评分
什么是点评分
图片
表情
视频
评价
全部评价( 0)
推荐率 100%
推荐
中国信通院启动“可信AI”AI Safety Benchmark大模型幻觉评测
3月19日,为深入了解大模型的幻觉问题现状并推动其应用落地,中国信息通信研究院人工智能所基于前期的AI Safety Benchmark测评工作,正式发起大模型幻觉测试。本轮测试以大语言模型为对象,涵盖事实性幻觉和忠实性幻觉两种类型,测试数据包含7000余条中文样本,题型包括信息抽取、知识推理及事实判别等。