全面赶超GPT-4?阿里云发布通义千问2.5,一文带你读懂通义千问

共 1673字,需浏览 4分钟

 ·

2024-05-10 10:18

2024年5月9日,阿里云官方在AI智领者峰会中官宣了通义千问2.5版本,并开源了1100亿参数模型Qwen1.5-110B

一 关于通义千问2.5

阿里云表示,与通义千问2.1版本相比,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%;与GPT-4相比,中文语境下,通义千问2.5文本理解、文本生成、知识问答及生活建议、闲聊及对话、安全风险等多项能力赶超GPT-4。但实际使用体验还需验证。

随着通义千问2.5的发布,阿里官方晒出了一张LLM排行榜的截图,在上海AI实验室推出的权威基准OpenCompass上,通义千问2.5得分追平GPT-4Turbo,GPT-4-Turbo-1106版本和Qwen-Max-0403并列第一名。是国产大模型首次在该基准取得该项成绩。

在最新的OpenCompass排行榜中,通义系列模型的排名有所回落,但依然处于第4和第5名。

OpenCompass司南 - 评测榜单:https://rank.opencompass.org.cn/home

二 关于Qwen1.5-110B

通义千问和Qwen模型之间的关系。首先,通义千问是阿里云推出的LLM模型的一个统称,模型分为闭源和开源两大类。闭源模型包括上面排行榜截图里的Qwen-Max-0403和Qwen-Max-0107等。开源模型则包括本次AI峰会提到的1100亿参数模型Qwen1.5-110B,以及小尺寸模型0.5B、1.8B、4B、7B、14B。而我们平时基于用户角度提到的“通义千问”则是指阿里官方基于通义闭源模型推出的免费的AI对话平台,类似于GPT系列模型和ChatGPT的关系。

Qwen模型:

  • https://github.com/QwenLM/Qwen
  • https://ollama.com/library/qwen
  • https://huggingface.co/Qwen

三 通义千问模型概览

3.1 商用模型

3.2 开源模型

四 通义千问 VS 文心一言 开源之路

AI“源神”启动!Llama 3发布,开闭源之争战局生变 这篇文章中我们提到李彦宏一直是闭源路线的忠实拥趸,认为大模型开源意义不大,闭源模型性能会不断提升。他也确实做到了,文心一言3.5 开源模型效果非常差。

反观通义千问

阿里云CTO周靖人表示:“开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力。” 未来通义大模型还会持续开源

通义大模型坚持开源战略,其开源的这些大模型也多次进入LLM模型排行榜前几名。在目前最新的LMSYS Chatbot Arena Leaderboard排行榜中,Qwen-Max-0428目前位列第10名,Qwen1.5-110B-Chat则为第13名,这在竞争极其激烈的AI大模型领域是非常不错的排名了。可以说,阿里把通义这个我国本土大模型做到了全球知名。

五 Qwen1.5 模型使用

在文章 打造个性化聊天机器人:用Ollama和Open WebUI搭建你的私有ChatGPT! 中我们使用 Ollama 可以直接Qwen模型。

六 参考链接

  • https://blog.csdn.net/weixin_40774379/article/details/138643052


浏览 49
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报