东数西算热潮下,关于数据中心建设的三个冷思考

共 4727字,需浏览 10分钟

 ·

2022-06-27 23:48

文丨智能相对论(aixdlun)

作者丨叶远风


热赛道上的冷思考:乘数效应才是东数西算的根本要求

从政策宏观导向,到地方、产业中观布局,再到企业、机构微观响应,算力时代已经汹涌而来。

就在6月23日,中共中央党校出版社最新出版、中国信息通信研究院主编的《人类计算简史:从中国算盘到数字经济》发布,该书就对计算与人类社会、经济发展的动态作用进行了一次盘点,其出版,恰好与如火如荼的“东数西算”相辉映——关于算力,理论的深度洞察与实践的全局推进在这个时间节点碰撞在一起。

“东数西算”已经成为与西气东输、西电东送、南水北调等并列的又一超级工程,而不同于其他世纪工程的“串联”属性(各地紧密配合完成同一件事的各个环节),“东数西算”更带有“并联”的特点(各地自主完成数据中心等基础设施,再并入到总体),这使得各地在数据中心等的建设上存在很大的自主决定权,也导致了“一拥而上、搭车乱建”等风险。

蒙眼狂奔之下,各地应该如何建设一个能够有效支撑国家宏观布局,又能契合本地实际的数据中心?答案,可能就在超级工程的“乘数效应”要求当中——工程所带来的价值,不应该局限在其本身,而应该是由这个工程引发出广泛的联动,通过循环和因果积累杠杆式推动宏观经济的变化。在6月23日的新书发布上,国家信息中心信息化和产业发展部主任单志广表示,“数据中心是新基建算力设施的重要代表,数据中心对相关产业链的投资拉动有非常好的效益”,这就是一种对乘数效应的期许。

在过去,乘数效应已经有深刻的实践,例如,南水北调不只有让北方“用水”更充裕,而更在通过“水”来推动地区从社会生活到经济发展的全局式变化,带来全新的经济社会局面。

“乘数效应”具体如何实现,这里认为,至少在三个方面,地区数据中心的建设需要关注。

双碳的乘数——
不能只是把同样的数据中心从东部搬到西部

东部是怎么建设的、西部就照着“搬过来”,正在成为一些地方建设数据中心的通常做法。

但是,东数西算最主要的价值内核,是提升数字经济发展过程中能源资源的利用效率,而如果只是将数据中心的建设从东部搬到西部,固然能够直接解决东部能源紧张无法有效支撑计算的问题,但其价值可能也仅限于此了。

从宏观政策的需求而言,东数西算与当下另一个战略政策热点“双碳”是紧密关联的,在推动“双碳”落地这个远景下,东数西算必须要同时推动能源利用的模式变化来实现自己在双碳方面的乘数效应,而非仅仅是资源占用的异地搬迁。

一方面,当下IDC的能耗状况已经到了十分凸显的地步。

根据公开数据显示,中国数据中心2022年总能耗将突破2000亿千瓦时,而据国网能源研究院则预测,到2030年,我国数据中心用电量将突破4000亿千瓦时,占全社会用电量的比重达3.7%。

如此巨大的数字,让数据中心的能耗状况直接影响到了双碳落地的全局,必须有对应的优化动作,而不是只是继承原有打法向西继续扩张数据中心的数量和规模。

另一方面,如何在单位能耗下,发挥更大算力或者现有算力如何降低能源的使用,变得尤为重要。

传统的数据中心在判断能源情况时,采用的指标是经典的PUE指标,但PUE仍然存在不足——只有关于IDC设备能耗占比的信息,如果PUE指标低(意味着传统评价好),但是能耗转化算力效果并不好,再低的PUE也不能说这个数据中心就做到了“能耗优”。

事实上,数据中心和数字经济在能耗方面的关系,无非是单位能耗能够产生多少产业价值的对应——IDC设备每耗费一度电,产出越多,数据中心在能耗上的指标就越优。而东数西算的一个重要背景,恰恰是老旧小散数据中心造成资源利用率低,大量的能耗投入换来的是低效的算力,需要集约化布局+新技术让每单位能耗的数字经济收益能更大,而PUE并不能全面反映这种能耗优化的过程——甚至,当下已经达到1.2、1.1的PUE指标再优化的空间已经不大。

因此,东数西算所建立的数据中心,不能再只看PUE指标来衡量能耗状况。行业需要一种更契合双碳主题下数字经济需求的算力评价标准,来形成国家宏观层面对数据中心建设的良性引导,从而引导行业健康发展。

而从前文的分析看,这里的算力评价更看重的应该是能耗被转化到算力上的“有效”性,按新书发布会上中国信通院云计算与大数据研究所所长何宝宏在谈到数据中心能耗时所说,即“要看到它对社会带来的价值”。于是,新的标准应该思考如何通过推广节能技术,利用有限资源提供更高效的算力,或者总结来说,是要推进“有效算力”的评价。

笔者认为“有效算力”应该成为东数西算工程的在双碳方面的解题关键点,而如何推进有效算力,为数据中心建设提供支持的华为,其集群计算解决方案给出了一个可行的答案。

在底层硬件、基础软件、应用衔接、计算架构等层面的全栈布局,让华为能够更大程度上推动能耗向算力的有效转化。

例如,在硬件上,新的计算架构的能耗优势被华为充分发挥;在软件上,欧拉操作系统、昇思MindSpore AI框架通过专业匹配与优化让能效更高,包括多瑙调度器在内的管理平台有效提升大规模集群的算力管理和使用效率;在整合解决方案落地上,大规模集群计算(例如“鹏程云脑”项目)拥有业界领先的多芯协作效率,等等。


由此可见,华为集群计算早已与“有效算力”评价标准的契合,东数西算的内在需要,让这种契合走向显性化。

发展的乘数——
不能只是顾及当下数字经济对算力的现有需求

目前,很多地方的数据中心建设还面临另一个问题,即仅仅面向通用计算大规模建设,而没有充分考虑到数字经济发展对AI计算的未来需要。

事实上,东数西算工程之所以迫切,一个重要背景在于智能化的快速发展对算力的需求在快速膨胀,强化了未来预期下东部算力资源的紧缺性,必须提前布局。


这些年来,智能化已经逐步成为产业数字化的核心能力,制造、交通、能源、政务、金融、医疗……各行各业都在呼唤智能化、数智化带来全新的驱动力,而解决方案的提供方扎堆东部几个主要城市,地区大量算力需求企业都在寻找优质的AI算力资源,一些时候AI算力资源的不足甚至影响了地区内AI创新企业的发展。

根据IDC的数据,全球人工智能收入预计到2023年将突破5000亿美元大关,无论是世界还是中国,数字经济都将进入以AI为核心驱动力的新阶段,拥有较高AI算力基础建设和应用能力的国家、地区或者企业才能从数字经济中获得更多红利。

于是,在东数西算浪潮中,数据中心的建设必须在AI算力这里侧重布局。与此同时,正如新书发布会上华为中国政企数据中心解决方案总裁常成所言,“人工智能本身是增量型的计算,更容易从顶层架构开始做好规划,先行先试”,因此,东数西算将是一次撬动智能经济全新增量的重要世纪工程,AI先行先试,通过西部AI算力向东部创新企业的输送,将带来全产业、全场景的深刻变革。

除了东部“需求方”基本面的分析,AI算力需求的增长还反映在“供给方”市场数据上。

国际权威机构IDC统计,中国AI算力已经占据全球市场40%左右的份额,处在领跑位置。而赛迪研究院预测,到2025年,我国基础算力和AI算力总量将分别超过300 EFLOPS和1800 EFLOPS,AI算力将大幅超越通用算力。

通用计算基数较大、增长相对缓慢,AI计算基数小却增长迅猛,未来AI计算超过通用计算成为算力主要供给已经成为必然。

在这样的大背景下,数据中心侧重AI计算已经成为必要。只是,不得不说AI计算的门槛要更高,是一件“难而必要的事”。好消息是,市场上依然有可以融合的力量,以昇腾AI代表,华为在AI计算方面的先行探索和积淀就是这样的储备力量。

目前,华为拥有全场景AI基础软硬件平台,且在产业实践上已经与大量合作伙伴共创“AI+行业”案例。

超强算力、更优能效的Atlas系列硬件,全面开源的AI框架昇思MindSpore,普惠开放的人工智能计算中心,昇腾AI计算产业正在成为东数西算时代AI算力的重要提供商。

而且,不同于通用计算的广泛适用性,AI计算更需要思考产业的契合,在布局时即要关联到实际应用。而这方面,昇腾AI计算已经在其生态合作伙伴的协作下,推出了经过运营商、金融、互联网、能源、交通、医疗、政务、制造等8个行业应用广泛检验的解决方案,能适配和满足各地不同的产业需要。

AI算力在这里推动智能化解决方案落地,就是在推动不同产业发展模式的根本变革,带来全然不同的工作效率和效果,提升我国的产业链地位,这是“乘数效应”的典型体现。

新基建的乘数——
不能只是一次原本数字设施的大规模敷设

东数西算是一次典型的新基建,将直接在产业规模上推动中国数字产业加速发展。

但是,这不意味着数据中心只要将原本市场上存在的各种惯常的ICT设施“再来一遍”即可。

数据中心是少见的产业链条长、覆盖门类广、带动效应大的数字产业项目,基础软件、IT设备、云计算等方面有很强的规模效应。从乘数效应出发,东数西算还需要通过产业链联动,撬动中国原创ICT技术长远发展,并以此规避可能的系统性风险。

通过东数西算来推动中国一直在创新的ICT原创核心技术走向规模化商用,将是一次难得的大规模落地机会,算力经济的新产业链构建能够直接推动这些技术跃上新的台阶。

此外,算力之争也是国力之争,各地数据中心建设就必须在自主创新技术上有所布局,而不是只关注传统计算中那些习惯了的、来自国外的技术做法。

目前,中国新计算产业快速发展,市场上能够满足这样的数据中心建设的厂商或品牌,包括鲲鹏、昇腾、飞腾,欧拉、麒麟、统信等,都具备较强的国际技术领先性,但由于市场信息不对称、应用生态还在快速发展没有实现广泛普及等原因,没有被很好地纳入到数据中心建设的视野当中去,未来数据中心的建设需要主动与新计算产业做更进一步的结合。

以欧拉为例,这个原本的“服务器操作系统”在进行升级后,已经在根技术创新的基础之上可以兼容服务器、云计算(云原生)、边缘计算、嵌入式等各种形态设备,能驱动广泛的数字基础设施,这在国内是首创,也更具备安全性。

数据中心与这种新计算成果的结合,将以“四两拨千斤”驱动中国新计算产业快速发展,反哺技术研发,带动更多创新产业进步。

当然,出于市场化、产业化的需求,当下的数据中心还需要保证自主创新技术与国外先进技术的平衡,前者的布局将是一件长期的事,只不过在初始阶段就应该重视起来。

结语

无论从双碳、AI计算还是自主创新的维度,东数西算的“乘数效应”要求已经显现,各地数据中心建设必须有所动作。

可以预见,“东数西算”工程将为我国以数据为中心的产业发展带来新的契机,并持续提升数据资产对于经济发展的贡献度,带动广大西部地区参与到智能化引导的数字经济浪潮当中。

但也要注意的是,在推进“东数西算”工程建设过程中,必须遵循经济规律、自然规律、社会规律,按规律办事,强化统筹和政策引导,稳步推进,推动全国数据中心适度集聚和集约发展,形成梯次布局和合理分工,合理划分物理边界和强化绿色节能、上架率等硬约束,避免一哄而上、盲目发展。

资料免费送(点击链接下载)

史上最全,数据中心机房标准及规范汇总(下载)

数据中心运维管理 | 资料汇总(2017.7.2版本)                                                    

加入运维管理VIP群(点击链接查看)

《数据中心运维管理》VIP技术交流群会员招募说明

数据中心运维管理咨询

浏览 23
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报