看齐世界最先进大模型!智谱AI 重磅推出国产大模型GLM-4

共 2380字,需浏览 5分钟

 ·

2024-03-24 02:00

a8e49ec38c7528aded77aeb03c4032d4.webp


2024年01月16日,由北京市科学技术委员会、中关村科技园区管理委员会、海淀区人民政府、中关村科学城管理委员会、华控技术转移有限公司指导,北京智谱华章科技有限公司主办的智谱AI首届技术开放日(Zhipu DevDay)在北京中关村国家自主创新示范区展示中心成功举办。现场,智谱AI团队全面展示了其投身于大模型事业三年多来所积累的技术成果,并重磅发布了新一代基座大模型GLM-4。作为清华知识成果转化的优秀成果,大数据文摘积极关注此次会议的学术思考与技术成果,进行详细报道。

此次会议邀请到中国科学院院士、清华大学教授张钹围绕“从大语言模型到通用人工智能”主题分享思考,针对生成式人工智能的现状和未来发表见解。针对大模型的现状和面临问题,张钹院士提出AI的三大能力与一大缺点,即强大的生成能力 (Strong generative ability);强大的迁移(推广)能力 (Strong transfer ability);强大的交互能力(Strong interactive ability);幻觉(Hallucination)。

他还提到:“GPT-4只能和数字世界打交道,我们最终必须跟物理世界打交道,这就需要机器人,也就是具身智能”。张钹认为不一定要做人形机器人,不需要把硬件搞得非常复杂,他主张以一定的硬件为基础进行强化学习研究。

张钹院士表示,生成式人工智能的突破点在于,基于上下文和过去的对话,AI几乎能够回答任何一个自然语言的问题。即能生成人类水平的文本,能实现人机的自然语言对话。张钹院士表示,任何国家和民族发展经济,必须发展人工智能。而对于新一轮AI威胁的论调,他认为AI未来会成为助手加入到我们当中。

a38a033519472a7c1b38f2807ceb0fbd.webp张钹院士发表主题演讲 此次GLM-4的发布及上线,是智谱AI大模型研发上的关键突破。GLM-4的整体性能相比上一代大幅提升,逼近GPT-4。它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。除此之外,GLM-4大幅提升了智能体能力,GLM-4 All Tools 实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。GLMs 个性化智能体定制功能亦同时上线,用户用简单的提示词指令就能创建属于自己的 GLM 智能体。 5ae914b06ff2a4ebef9ecadf9a02a2c5.webp张鹏发布GLM-4 具体来说,GLM-4可以支持128k的上下文窗口长度,单次提示词可以处理的文本可以达到300页。同时,在needle test(大海捞针)测试中,128K文本长度内GLM-4 模型均可做到几乎100%的精度召回,并未出现长上下文全局信息因为失焦而导致的精度下降问题。同时,多模态能力方面,文生图和多模态理解都得到了增强。 此外,GLM-4的All Tools能力全新发布。得益于GLM模型的强大Agent能力,GLM-4实现了自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和文生图CogView3模型。同时,GLM-4 通过代码解释器,会自动调用代码解释器进行复杂的方程或者微积分求解。对比GSM8K、Math以及Math23K三个数据集上的结果,GLM-4 All Tools取得和GPT-4 All Tools相当的效果。GLM-4的All Tools能力完全自动,而且可以处理各种任务,比如包括文件处理、数据分析、图表绘制等复杂任务,支持处理 Excel、PDF、PPT 等格式的文件。 7d1facadc680c176684b01ce9d8cb741.webpGLM-4演示 GLMs个性化智能体定制能力也同步上线。基于GLM-4模型的强大能力,用户只要登录智谱清言官方网站( https://www.chatglm.cn/ ),用简单的提示词指令就能创建属于自己的GLM智能体。并且,用户可以通过全新上线的智能体中心分享自己创建的各种智能体。GLM模型智能体的推出标志着任何人都能够自由运用GLM-4模型并挖掘它的潜力,没有任何编程基础也能够实现大模型的便捷开发。这是智谱AI为降低大模型使用门槛所做的最新努力。 1134aafe030d2cb1ee5ea9432e7f27bf.webpGLMs模型应用商店推出 此前,智谱AI分别联合CCF中国计算机学会、中国中文信息学会社会媒体处理专委会发起了CCF-智谱大模型基金、SMP-智谱大模型交叉学科基金,用于支持大模型理论、算法、模型、应用等相关研究和跨领域交叉创新。去年两支基金为来自全国三十余所高校参与的41个研究项目累计提供了超1000万元现金和算力资源的科研支持。 2024年,智谱AI也将发起开源开放的大模型开源基金,该计划包括三个“一千”:智谱AI将为大模型开源社区提供一千张卡,助力开源开发;提供1000万元的现金用来支持与大模型相关的开源项目;为优秀的开源开发者提供1000亿免费API tokens。张鹏表示,大模型开源基金的目的在于推动大模型研发的大进展,促进大模型整个开源生态的大繁荣。面对全球的大模型创业者,智谱AI也将“Z计划”进一步升级,联合生态伙伴发起总额10亿人民币的大模型创业基金用于支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。 2024年被业界普遍认为是人工智能发展历史上的又一重要年份。智谱AI CEO张鹏表示:“大模型创新研发是一条长征路,一枝独秀不是春,我们希望与人工智能行业所有的参与者、产业链上下游合作伙伴、开发者社区、学术界一同努力,为中国AI新未来贡献绵薄之力。”

eecdab75c2c96de5f8e73d307a29cd3a.webp


租!GPU云资源 新上线一批A100/A800 运营商机房,服务有保障 bce67f48531bd33a3c407ac1c8b686b3.webp扫码了解详情☝ 73657f95c3b8cb7c1f048572de97df07.webp


8a88c34f1267e1cb3be608b6fb052678.webp点「在看」的人都变好看了哦!
浏览 22
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报