动态基准测试Dynabench已发布,Facebook想用人类来「审问」人工智能
新智元
共 2395字,需浏览 5分钟
·
2020-10-11 07:57
新智元报道
新智元报道
来源:Facebook
编辑:QJP
【新智元导读】Facebook已经建立并正在共享Dynabench,这是第一个用于人工智能领域的动态数据收集和基准测试平台。它使用人类测试和模型一起循环迭代,目的是为了创造具有挑战性的新数据并且更优化的人工智能模型。
人工智能在过去十年左右的巨大成功通常归功于大量的数据和计算能力,但是「基准测试」在推动进步方面也发挥着至关重要的作用。
Dynabench:新的动态对抗性benchmark
静态基准测试-忽略了与人交互的体验
测试地址:https://dynabench.org/
参考链接:https://ai.facebook.com/blog/dynabench-rethinking-ai-benchmarking/
评论