Google发布最强大模型,从评测上Google的评测结果来看确实很强.
共 1072字,需浏览 3分钟
·
2024-03-20 06:00
当地时间12月6日,谷歌发布迄今为止功能最强大、最通用的多模态 AI 大模型Gemini 1.0系列(中文译为“双子座”),共包括Ultra、Pro和Nano三个版本。其中,Gemini Ultra已超越了GPT-4,甚至在MMLU测试得分高达90.0%,成为第一个超越人类专家水平的 AI 模型。
1)从自然图像、音频和视频理解到数学推理,Gemini Ultra 的性能在大型语言模型 (LLM) 研发中使用的 32 个广泛使用的学术基准中的 30 个上超过了当前最先进的结果。2)Gemini Ultra 的得分高达 90.0%,是第一个在MMLU(大规模多任务语言理解)上超越人类专家的模型,该模型结合了数学、物理、历史、法律、医学和伦理学等 57 个科目来测试知识和解决问题的能力。
凭借强大的性能,Gemini一夜爆红,引来了华尔街的关注。12月7日,谷歌母公司Alphabet(Nasdaq:GOOG)的股价涨5.31%,收于136.93美元,迎来自今年8月29日以来表现最好的一天,总市值达到1.72万亿美元。
官方文:
https://blog.google/technology/ai/google-gemini-ai/?utm_source=twitter&utm_medium=social&utm_campaign=GDMGemini#performance
60页技术论文:
https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf
如需, 后台领取。
但有分析指出,谷歌在Gemini的宣传资料中存在夸大宣传的嫌疑。在质疑发酵后,谷歌DeepMind研究和深度学习负责人副总裁奥里奥尔·维尼亚尔斯(Oriol Vinyals)也在X(原推特)平台上发布长文,解释了团队是如何制作该视频的:“视频中的所有用户提示和输出都是真实的,只是为了简洁而进行了缩短。”维尼亚尔斯还表示:“该视频展示了使用Gemini构建的多模态用户体验是什么样子。我们这样做是为了激励开发人员。 因此这一次的视频事件会让人们更加怀疑Gemini的可用性。“至少在公众看来,谷歌已经被OpenAI今年的巨大成功打了个措手不及。如果它想激励开发人员,就不能通过精心编辑的、可能歪曲人工智能能力的精彩 视频。”