《2024行业大模型调研报告》发布(附下载)
共 7161字,需浏览 15分钟
·
2024-05-15 08:29
大模型
与传统AI仅能处理单一任务相比,大模型技术通过其庞大的参数规模、强大的泛化能力以及对多模态数据的支持,展现出类似人类的通用智能“涌现”能力,能够学习多个领域知识、处理多种数据和任务。
OpenAI提出的“规模定律”(Scaling Law)驱动了大模型的快速发展,即:模型的性能与模型的规模、数据集大小和训练用的计算量之间存在幂律关系,性能会随着这三个因素的指数增加而线性提高,通俗而言就是“大力出奇迹”。传统AI模型参数量通常在数万至数亿之间,大模型的参数量则至少在亿级,并已发展到过万亿级的规模。
大模型带来的AI性能突破,激发业界向通用人工智能(AGI)领域进发的新热潮。
扫码下载:
行业大模型指利用大模型技术,针对特定数据和任务进行训练或优化,形成具备专用知识与能力的大模型及应用。如果说通用大模型是通才,行业大模型就是专才。与通用大模型相比,行业大模型核心在提高性价比、增强专业性并保障数据(特别是私有数据)安全。
业界对行业大模型还有模糊和争议之处,本报告主要尝试厘清三个问题:一是行业大模型既有模型、也含应用;二是行业大模型大多长在通用大模型之上,基于通用大模型进行再开发;三是行业大模型具备定制特征,本质是解决方案、而非只是一个产品。
可以这样理解,行业大模型中的产品通常是“毛坯房”,客户需要根据自身用途进行“装修”才能满足需要。例如,腾讯云2023年中旬就依托TI平台打造了行业大模型精选商店,推出了MaaS服务,为客户提供一站式的行业大模型解决方案,包括模型预训练、模型精调、智能应用开发等。
行业大模型整体处于发展早期,还没有大规模成熟应用的范例。参考埃弗雷特·罗杰斯(Everett M. Rogers)《创新的扩散》一书中对创新阶段的界定,行业大模型应用阶段可划分为探索孵化期、试验加速期、采纳成长期和落地成熟期,基于“百人百问”目前大部分行业处于前两个阶段,还没有行业达到第四。
数字原生行业(如各类互联网应用)是先行者,传统行业中生产性服务业(广告、金融等)进展相对快、重资产行业(建筑、制造、能源等)进展相对慢。背后有两个核心影响因素:需求的适配度和数据的可得性,越高的行业进展越快。
在“人工智能+”等重要政策指引下,行业大模型有望加速在传统行业的落地应用,在云智一体的基础设施支持下,向多模态、人工智能体、端侧及小型化等方向发展,更深入嵌入各行业的工作流程中,从而促进生产力的提升。
人工智能体(AI Agent)的发展,对行业大模型的意义可能最大。一些与工作流程深度耦合的AI Agent开始涌现,有望逐步发展成为各行各业不可或缺的新型生产力。办公领域,Microsoft 365 Copilot及其个人版Copilot Pro的推出,揭示了提高工作效率和办公自动化方面的巨大潜力;社交领域,Meta AI等产品将进一步推动内容创作和社交互动的智能化,为用户带来更加丰富多样的体验;工业领域,Levatas等工业视觉检查机器人的应用,显示了在识别、判断和维修设备方面的高度自主性;营销领域,SalesGPT等平台的出现,展示了AI Agent在感知情绪、个性化推广和客户服务中的潜力……
随着AI应用的深入,模型的规模、类型和复杂性将不断增加,MaaS将日益成为行业用户云上用智的主流方式。用户或直接调用云的大模型API,或借助全生命周期的大模型训练工具,生成适用于自身场景的大模型,并托管在云上,为最终用户提供高质量智能服务。为此,面向AI的、更高性能的算力底座必然不可或缺,通过计算、存储、通信、训练等各层面的优化,全面提升模型训练、开发和应用效率。
报告内容如下