数据中心CPU芯片,ARM可堪重负?

智能计算芯世界

共 3853字,需浏览 8分钟

 ·

2023-08-10 20:07


数据中心是算力的聚集地,绝大多数算力都聚焦在超算中心、数据中心并以服务器释放到千行百业。在行业数字化及国产化进程中,x86、ARM及RISC-V等各种架构派系处理器、服务器、加速器都以独特技术优势在数据中心散发着“光”和“热”。

本文从数据中心芯片占比、应用生态兼容、性能、技术演进等维度着手,分析国内基于ARM芯片厂商的行业兼容性及应用生态现状。


一、超算中心现状及芯片占比


纵观超算中心,从第60届TOP500榜单数据显示,Intel仍然是超算系统中最大的处理器厂商,占有率达到75.80%,Xeon芯片超算系统中应用普遍,最新入榜的Leornardo采用的就是Xeon Platinum处理器。

AMD处理器是受欢迎的HPC系统芯片,其占有率20.20%,且占有率持续增长(从18.60%上升至20.20%)。TOP500系统中有101个系统采用AMD处理器,例如排名第一的Frontier和排名第三的LUMI。

从TOP500榜单数据来看,基于Intel和AMD的x86架构CPU占据超算中心96%系统份额。

不难理解,超算中心重点考量指标就是算力(Benchmark)和系统性能(业务Workload),这正是以x86为代表的复杂指令集的强项。

从算力角度讲,CPU乃至服务器架构设计决定算力,尤其是浮点及双精度运算能力,64位浮点数字的计算(FP64排名第一的Frontier超算系统就基于HPE Cray EX架构,第三代AMD EPYC处理器保证极高性能。

系统性能方面,在如天气预报等精度要求极高仿真行业,不仅需要超高算力,还需兼容CPU架构的商业软件保证系统性能,行业及CPU架构高度优化过的商业软件才能保证系统性能、业务效率及准确度。


从《开放架构HPC技术与生态白皮书》可得知,超算及数据中心应用生态的行业,例如油气、制造CAE等行业以商业软件为主,涉及核心算法、实践经验积累,对结果精准的要求并非开源软件可替代,x86架构对商业软件支持的完备度最高。


二、ARM数据中心份额及生态


在超算中心,ARM处理器表现平平;虽然日本Fugaku系统 TOP500榜单排名第二,但该系统并非通常意义上的ARM架构,而是由富士通基于超算优化版的A64FX处理器。市场份额上,ARM属于Others阵营,与RISC-V等架构同属4%行列。

在数据中心,x86市场份额依然坚挺,据IDC数据,Intel和AMD x86合计市占率91%;ARM在依然属于Others阵营;但在非X86领域,ARM以低能耗、高效率、发展时间长的优势占据移动终端市场的主导地位,使用最广泛、发展最成熟,市占率达到43.2%,远高于RISC-V 9%。在移动终端方面,ARM占据绝对优势。


回归到RAM生态,ARM在HPC行业应用系统兼容生态完备度较强,如教育、气象、生命等重要的科学计算领域中都有开源软件ARM 指令集版本,少量或无需开发即可完成软件移植。

然而,在传统行业,如智慧城市、数据库、中间件等应用受限细分行业及场景差异性,兼容复杂性等诸多因素,兼容覆盖度略显不足,一般按需定制开发。


三、ARM芯片架构及玩家分析


ARM作为精简指令集,其优势在功耗比,结合其在移动终端领域市场优异表现,决定主要应用在移动和嵌入式市场。

从功耗来讲,对于单CPU的手机采用arm来降低功耗效果是非常明显的;但在数据中心、超算中心,服务器结构复杂,如磁盘、加速卡等数量远高于CPU,这导致服务器的主要功耗不在CPU,因此,衡量数据中心能耗的方式也与移动终端不同。

数据中心有专有冷却装置保证数据中心的整体能耗:PUE,如超算中心Green10排名第3的Adastra系统(319,072核,HPE Cray EX235a),相比Setonix- GPU系统(181,248核,HPE Cray EX235a),CPU核数更多,Green10排名反而更靠前。


在性能上,ARM芯片依靠多核心堆砌,单核性能相对薄弱(单CPU堆至64核),尤其在双精度浮点运算总体比不上x86架构芯片性能。由于新型XPU加速卡算法、算子库都基于x86开发,难以通过加速卡在ARM架构上进行性能加速。

制于ARM芯片性能、生态原因,桌面PC发展也受到一些限制。国产ARM芯片在PC电脑的应用更为惨淡,目前主要为飞腾PKS体系内。

在人工智能背景下,ARM除了性能、生态的本身问题外,V9架构迭代的延续性问题导致在数据中心领域发展空间受限。

目前国产Arm架构CPU服务器玩家大体分为华为的鲲鹏系和中电子的飞腾系。飞腾、华为等公司已掌握 Arm64 处理器核、微架构及芯片设计相关技术。

华为发布了一系列基于 Arm 架构的服务器产品,如2019发布的鲲鹏920,作为7nm数据中心ARM处理器,专为大数据处理以及分布式存储等应用而设计。而飞腾则建立了PKS体系,主要也用于服务器产品,分为高性能服务器芯片、高效能桌面芯片和高端嵌入式芯片,现在移动终端市场占据统治地位。


、ARM、RISC-V困境及国产发展之道


当前国内六家主流CPU厂商鲲鹏、飞腾、兆芯、龙芯、海光、申威纷纷发力,从国外引进各种不同技术架构如ARM、X86、MIPS等;八仙过海各显神通。

国产CPU产业产生了三种不同的路线,海光和兆芯基于x86指令集在商业应用领域更具优势,龙芯和申威依靠自主研发的优势在特种应用场景上受到青睐,鲲鹏、飞腾基于ARM架构,在具有优势的特定赛道寻找超车的机会。

相比占据垄断地位的x86指令集,ARM指令集本身作为弯道超车思维的产物。ARM指令集的优点在于功耗小,能效比优秀,打开了移动端设备和消费类电子的市场,这也跟ARM在移动终端的市场优异表现一致。

鲲鹏系主要是以华为自家TaiShan系列服务器为核心,向服务器合作厂商(如神州数码、宝德等)出售鲲鹏主板。近两年在鲲鹏和飞腾的大力推动下,国内ARM生态发展迅速,但目前国内市占仅有7%。

飞腾则基于PKS体系,在信创领域有较好的市场表现。飞腾CPU(Phytium)和麒麟操作系统(Kylin) 和S-Security”的立体防护安全链,在安全性上有更明显的优势,从而在对信息安全要求更高的领域,获得了一席之地。


相比RISC-V,ARM经过二三十年时间的积累,已经形成了比较完善的生态,尤其是在基础软件方面,包括操作系统、基础库、编程语言与编译器、开发环境和运行环境等等,对CPU架构有个支撑。

无论鲲鹏依托华为生态还是飞腾PKS体系强调的安全性,本质上还都是ARM处理器在特定领域发展自身生态,以切入一个特定市场。


五、总结


从生态长远来看,一方面,ARM服务器跟数据中心主流x86生态相互不兼容,如果用户需要从x86平台切换到ARM平台,迁移工作量大;并且因为各行各业部署环境不相同,软件问题很难从服务器厂商获得帮助。另一方面,开源为产业入局开启一扇窗,但同时,对企业创新及差异化优势又筑起了一道墙,ARM版本的开源软件在商用之前往往需进行功能完善、性能调优,工作量及难度大。

在应用场景上,鲲鹏系和飞腾系都是基于既有生态和行业在服务器领域优势,逐渐向数据中心、存量x86市场迈进,但ARM在应用性能、生态、技术演进等方面的不足需要时间逐步完善。

在技术上,鲲鹏和飞腾均获得ARM v8指令集授权研发设计CPU产品,但ARM指令集演进问题一直被诟病。对于国内信创产业,ARM架构在延续性和自主性的问题亟待解决。




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。


温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。



浏览 1006
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报