自研大模型,打造手机智能体,vivo创新的“雁行致远”
搭载自研AI大模型矩阵的“手机智能体”,彰显vivo "以用户为导向"的产品创新理念。
我是谁?我从哪里来?我要到哪里去?
这是古希腊思想家、哲学家柏拉图提出“灵魂三问”,也是人类哲学的究极问题。
世界上第一部手机自1973年诞生之后,历经功能手机到智能手机、模拟通信到5G技术的不断迭代之后,未来又将向何处演进?同时,ChatGPT等大模型应用诞生,不仅让国内短时间就爆发了“百模大战”,也为AI的各行业应用开启了全新赛道。
当智能手机与大模型“一相逢”,可谓“激发惊喜无数”:不仅为陷入创新减缓周期的智能手机行业点燃了全新科技树,也让整个行业看到了“要到哪里去的”的究极创新方向。
近期举行的2023博鳌科创论坛开幕式上,vivo执行副总裁胡柏山就给出了一个明确的“新答案”。
胡柏山表示:生成式大模型意味着新一轮技术革命即将发生重要转折,中国科技企业正在面对巨大挑战,但并没有任何捷径可走,必须坚定投入夯实包括AI、芯片等“研发底座”,坚持始终以用户为导向的“有温度创新”,同时要推动企业单一创新向生态协同创新的“雁行致远”模式升级,才能让中国科技企业加速走向“充满无限可能的未来”。
备受业界关注的是,胡柏山此次演讲中提出了“vivo很快就会发布自研AI大模型”,并提出了“手机智能体”的全新理念。vivo副总裁、vivo AI全球研究院院长周围随后也在接受《第一财经》专访时证实:“带有大模型的手机很快就会伴随vivo新机来到大家面前”。
vivo是最早关注AI应用在手机创新的科技企业之一。
2016年,AlphaGo以4:1轻松战胜世界围棋冠军李世石,并在次年以3:0再胜柯洁,后者那句“AI时代的围棋无聊透顶,使人类棋手丧失了存在的意义”震惊了整个围棋与科技行业。
vivo是被深深震动的科技企业。2017年夏天,vivo创始人、CEO沈炜带着核心团队在美国东、西海岸拜访了两周之久,包括在人工智能领域享有盛誉的卡内基梅隆大学。沈炜与vivo核心高管们迅速达成一致判断:人工智能时代已真到来,作为新变革时代最底层的创新技术之一,vivo将在未来很长一段时间内都将在人工智能领域进行“过饱和”投入。
vivo人工智能全球研究院也于当年开始筹备,于2018年正式成立,并且开院就投入了目前已经达到超过千人的规模。
也就是说,当很多手机企业还在拼硬件配置与“用价格换市场”之时,vivo已经在人工智能研发领域“抢先一个身位”,并且至今已经“过饱和”投入超过六年。这其实也是vivo可以再次领先其他手机企业““发布自研AI大模型”的重要原因。
作为vivo人工智能全球研究院院长的周围认为,vivo做好自研AI大模型,必须要做好三件事情:大模型能力足够优秀,具备很好的应用大模型,通过共创共赢解决行业需求问题。
这实际上也回答了大模型的创新实质、能力落地与产业长期健康发展三个核心问题。
当然,“看得见”与“做得到”之间,注定还存在一系列“鸿沟”式的挑战与难题。vivo也为此进行了确定性的长期投入,对大模型应用的实现拆解,以及独特思考理解与方法论建立。
首先,vivo从大模型背后的人工智能技术“溯本求源”,并将其拆解为“四大要素”:数据、人力、算法加算力。
vivo认为,大模型的本质是在人类数千年的文明与知识基础上,以更高维度的压缩、抽象与理解来给到所有用户。这也是人类有文明以来的“终极理想”之一:让知识普惠,让所有人都可以掌握高阶的文化积累,从而让文明和创新可以更好地延续。
vivo人工智能全球研究院成立的第二年,vivo图谱研究院成立,其使命就是通过建立专业团队来搭建专业的知识图谱体系,并找到更先进的高纬抽象能力。成立第一年,图谱研究院就投入了300人的研发队伍,到今年整个图谱数据已超过2800T,在经过筛选和清洗之后,目前用于大模型训练的有效数据大约是150T。这相当于1.6亿侧图书,或者2.5个中国国家图书馆的藏书量,从而满足了如今大模型所必须具备的完整数据底座。
那么接下来,如何用好这些数据?并以“更高维的抽象能力”给加速大模型的训练与应用?
这就涉及到“人力”与“算法”。
vivo人工智能全球研究院在2021年初投入AI大模型的研发就已经超过600人。这同样是一笔巨大的研发投入,比如根据相关机构的统计数据,国内人工智能工程师和算法科学家的平均年薪已经超过60万元,并且“人员缺口巨大”。与之相比,Open AI公司早期核心团队大约150人,之后增长到300人左右。从这个维度,也可以更加清晰地看到vivo在AI领域的投入决心与长远目标。周围在媒体专访中也用了“应对大模型游刃有余”来概括vivo在人工智能领域的深厚储备。
算法同样是vivo的“显性优势”之一,这点在vivo在行业具有标杆地位的影像、Jovi智慧助手等方面都可得到印证。周围透露称,算法是vivo人工智能研究院成立之初就确定的核心方向之一,比如整个团队已经发布了超过70篇人工智能领域的全球顶级论文,同时也专门成立了一个团队去跟踪全球最先进的论文和理念,并将其转化为vivo的算法训练和工程应用,其目标就是“对标行业最前沿”。
算力作为人工智能的“引擎”,也是如今所有大模型的“瓶颈”。国际欧亚科学院院士、IEEE/CAAI Fellow田奇就表示:AI大模型开发和训练一次的成本高达1200万美元。而据海外媒体报道,ChatGPT4一次完整的训练更是高达6000万美元。这种挑战对于中国科技企业而言更加突出:不仅要考虑成本,还要考虑能否买到最先进的GPU等算力设备。
vivo的做法,是在加大算力投入的同时,通过工程能力的创新充分挖掘算力潜力,实现更加高效的模型训练和推理部署,这其实也是如今很多大模型企业正在达成的共识。单就算力这个模块,vivo就布局了一个150人左右的强大工程团队,这让vivo在不断提升算力的同时,保障大模型具备更加强劲的持续成长进化力。
从如何充分挖潜数据、人力、算法、算力的人工智能“四要素”,再到“打造行业前二大模型”,实际上都可以看到vivo在研发领域的两个突出理念:“长期主义”,以及“向下深入科学底层,向上打破科技天花板”的坚定态度。
就如胡柏山在2023博鳌科创论坛开幕式所说:科技企业要保持竞争力、实现健康长久发展,没有捷径可走,必须夯实“研发底座”,在AI、芯片、通信等底层技术上坚定投入、大力投入、长期投入,建立深厚的技术储备,才能充分应对各种不确定性,赢得面向未来的全新发展机遇。
从用户角度来看,一个通用的大模型,并不意味着可以解决所有问题,甚至大模型,“大”也可能并不是所想要的方向。
但如果从“人手一台”的智能手机入手,大模型可以更加高效地完成与大众用户和实际应用场景的连接。这其实也是高通、谷歌、微软、华为、vivo等主要科技企业都在推动“端侧大模型”创新的重要原因。
今年3月的2023 MWC上,高通就展示终端侧运行超过10亿参数模型,基于文本输入生成图像的Stable Diffusion演示,且性能和精确度达到与云端相似的水平。
胡柏山在2023博鳌科创论坛开幕式首次提出的“手机智能体”的理念,无疑距离产品实用化和市场普及更近一步。
在之后的媒体采访中,周围透露了更多信息,概括来看,主要有三点:首个大模型矩阵,智能体验“颠覆性”改变,以及“绝非噱头的成熟体”。
vivo公布的大模型,首批将会有5个。周围解释称,相比很多互联网企业提出的“单个通用大模型”,vivo打造的“大模型矩阵”,可以更加聚焦精准地解决用户痛点需求,同时有效缩短响应时间,降低能耗问题。
以如今的智能手机为例,如果用户通过智能助手提出“帮我订制一个旅行计划”或者“帮我订一个5天后的深圳酒店”等类似需求,得到的答案往往既不准确,响应时间也多在数秒以上。vivo为此做出了1B的专用大模型,将输入法和Jovi接入之后,不仅可以更加精准地了解用户的实际需求,还可以做到更加“懂你”的提供精确化、人性化智慧服务,同时响应时间也会大大缩短。而这种“秒回解决实际场景需求”的能力,才是用户最为关心的智慧化能力进阶体验。
能耗是大模型的“命门”,也是智能手机的用户痛点。如今ChatGPT每训练一次,相当于释放3000辆特斯拉电能,放在智能手机上完全承受不起。vivo通过将端侧NPU算子化,将能耗控制“相当于在手机上听音乐”的范围,从而解决了大模型在智能手机上的长期运行难题,这在运动健康等需要持续低电量监控运动场景的应用上尤为重要。
另一个是成本,vivo国内用户超过3亿,以每个用户每天用10次大模型来计算,一年成本就在百亿元规模。因此vivo推出了10亿的大模型、70亿的大模型、660亿的大模型、1300亿的大模型和1750亿的大模型,可以根据用户场景和实际需求分别计算,从而更好地推动成本、能耗等问题的解决。
周围透露称,以7B大模型为例,在通过多个中文榜单的验证,vivo大模型在中文能力的综合得分已经超过了ChatGPT4, 在C-Eval(大语言模型的多层次多学科中文评估套件)排行榜上,以74.3的平均成绩位列榜单前二。这个成绩足够令人感到吃惊,也足以说明vivo打造“大模型矩阵”的突出能力与方向正确性。
这就像是《水浒》中的108将,每个人都有不同擅长的武器和特点。如果“单个通用大模型”更像是“全军突击”,那么vivo的“大模型矩阵”可以更好地发挥每个将领的优势,从而更加精准地解决用户的实际需求和场景痛点,并且单个模型的进化学习也会越来越高效。
周围对此表示:vivo希望大模型接入手机之后,并不是简提升一个人机对话体验,而是深入到用户的出行、学习、生活、工作等众多场景,并带来真正的“全面颠覆性创新”。周围举例称:比如你在开会时,可以迅速地获得类似专业公司给你撰写的行业报告;在出行等场景中,可以基于用户的需求、习惯和场景进行主动推理和决策,而不是被动的工具执行属性。这才是vivo不惜成本,将7B大模型放在每一个手机用户中的原因和动力。
vivo并不是首个提出将大模型与手机结合的科技企业,但却让业界首次看到了“手机智能体”对于用户生活带来实际改变与创新价值。这符合vivo一贯的“本分”企业价值观,也再次印证了vivo"以用户为导向"的产品创新理念。
一如vivo成立28年来所走出的每一个踏实脚印:从电话机时代满足用户的高品质需求、功能机时代重视用户的设计与音乐风尚,到智能手机市场对用户强烈关注的设计、影像、系统、性能“四大技术长赛道”的聚焦与领跑,再到如今人工智能时代的大模型矩阵与手机智能体的紧密融合。
《壹观察》非常认同胡柏山在2023博鳌科创论坛开幕式上说的一句话:AI不仅是黑科技,更要服务于人的日常需求。无论科技如何发展,vivo始终要坚持以用户为导向,围绕用户需求进行差异化、有温度的创新,让AI飞入寻常百姓家。
从1973马丁·库帕拨出了世界上第一通手机电话,手机产业演进已有半个世纪之久。即使从初代iPhone发布算起,智能手机行业的发展也历经16年。放在长周期来看,手机行业每隔十余年就会伴随技术变革发生巨大变化,放在短周期来看,由苹果定义的“智能手机创新形态”也进入了典型的创新减缓周期。
手机创新的下一个形态在哪里?
有人说是折叠屏,但这仅限于屏幕和交互层面的“渐进式革新”,并不属于“颠覆性创新”,并且显然无法满足所有人对手机智能化的新变革期待。
大模型的到来,相当于通过对手机的“AI大脑”重构,从而带来智能终端产业深层次的巨大变革。
比如,用一个交互入口,改变移动互联网时代海量APP之间的数据鸿沟。通过大幅提升“端侧智商”,改变用户对智能手机“积累场景智能”的传统印象。甚至通过云端一体的易购计算与服务跨端协同,实现终端“去中心化”“主动智慧服务无处不在”。
大模型的到来,显然为以上这一系列设想提供了“更优解”。
同时带来的另一个新问题,就是如何在万物互联时代打造包容更多企业参与的“协同创新生态”,从而实现技术的跨领域和跨学科耦合,海量终端的高效连接与数据高效流转,以及大模型在新协同创新生态中伴随海量数据聚合下更加高效的学习训练与整体进化。
vivo的态度非常明确:通过主动开放合作,推动整个行业共赢共建共创。周围在接受媒体采访时强调了两个信息:一是大模型是手机行业新创新周期的开始,这是整个行业的挑战和机遇,因此必须从整个行业的健康长期发展来考虑这个问题。二是vivo作为人工智能的创新引领企业,也要主动积极地承担起这个角色和责任,帮助行业首先解决大模型供给问题,比如vivo接下来将把7B大模型这个全行业榜单领先的能力贡献出来,包括模型的热拔插能力,从而解决不同企业与合作伙伴的数据需求。
vivo的这一选择,与很多还在积极“筑墙”的企业形成了鲜明区隔。
这家近30年的的中国科技企业,已经从当初的“东莞小厂”成功晋级为全球手机TOP5级别的科技大厂,业务遍布全球众多国家和地区。如今的vivo,有了深厚的技术积累,也拥有了对应的产业责任与企业理想。
沈炜在近两年的内部讲话中,明确提出了两个目标:“伟大企业”与“基业长青”。
伟大企业,从来不是“创新独夫”,而是需要带领整个行业去探索发现新的市场沃土,共同推动技术变革与创新普及。而“基业长青”的企业,更是需要有足够的产业胸怀和创新耐力,推动合作伙伴共同穿越技术与市场周期。
从科技革新维度来看,自上个世纪50年代人工智能诞生之后,历经多次潮起潮落,终于进入了“大模型改变人工智能,人工智能改变世界”的全新周期。未来人工智能无处不在背后,同样是“大模型无处不在”与“智能场景应用无处不在”。
这应该也是vivo如今作为领先的大模型技术企业,依旧强调从单一企业领跑到推动开放协同创新生态的重要原因。显然,vivo并不想凭借大模型先发优势“挖城墙”,而想希望成为人工智能时代的“头雁”之一,推动中国科技企业达成深层次的协同创新模式,去应对新周期的各种“不确定性”,以及满足用户对诸多“不可能”的向往追求。
这是一种“雁行致远”式的产业理想,也是大模型与智能手机结合、打造全新产业生态的正确方式。
路虽远行则将至,事虽难做则必成。
就像胡柏山在2023博鳌科创论坛开幕式上所说:未来不是被预见,而是被创造。用户需求永远都在创新能力之前,科技企业应有使命感,遵从本心,深耕价值。
这样让我们在2023年的智能手机创新放缓周期,对vivo接下来的产品充满期待。据悉,vivo将会在vdc开发者大会发布的OriginOS 4搭载自研大模型。
END
「壹观察」创始人宿艺
原搜狐科技通信主编
今日头条、腾讯新闻、搜狐搜索「壹观察」
百家号、微博、抖音搜索「宿艺」关注更多
丨智能硬件丨通信丨新零售丨人工智能丨
丨智联网汽车丨智能家居丨
转载、合作联系微信:yiguancha_01