新冠和癌症都能解决?看E级时代的HPC会带来多少可能

雷锋网

共 7421字,需浏览 15分钟

 ·

2021-10-28 02:21


道、术、势三合一带来的天时+地利+人和,就是英特尔持续发力高性能计算创新的底气所在。


作者 | 包永刚

编辑 | 李帅飞

长久以来,高性能计算(HPC)给人的印象总是神秘且高深。这是因为它主要是学术界用来推进基础科学发现和探索的手段,比如上到宏观的宇宙大爆炸模拟、下到微观的量子物理和分子动力学研究,这种级别的话题一抛出来,就会有“生人勿近”的感觉。

然而,新冠肺炎对我们的突然袭击,让很多人重新认识了高性能计算:它非但不“高冷”,对热点事件的反应还出人意料的快——不论是中国还是全球,领先的基因与药物研发机构,在高性能计算的支持下,少则数小时,多则几天就破解了新冠病毒的结构,并立即开始疫苗的研制。

可以说,正是高性能计算在算力上的爆发式增长,让过去以“年”来计算时长、且需要无数次实验来纠错的病毒和疫苗研究过程发生了翻天覆地的变化,这种变化还不能只用一个“快”字来概括,而是“快”与“精准”兼顾。

“高性能计算是改变世界和丰富地球上每个人生活背后的创新,”在日前于珠海举办的2021 CCF全国高性能计算学术年会(CCF HPC China 2021)上,英特尔公司副总裁Trish Damkroger就在其主题演讲中这样总结道:“每天都有新的用户憧憬使用高性能计算系统的新方法来应对越来越多的高性能计算和AI的挑战。例如制造企业利用高性能计算系统来设计性能更好的运动装备,铁路公司使用托管的天气预报服务来避免脱轨,药剂师使用机器学习来查明药物中的有害成分。” 

Trish的话,对于整个高性能计算行业而言已不仅仅是思想上的共鸣,而是正演进为重塑这一技术及行业的共振。亲历了这场中国顶级高性能计算行业峰会,并站在E级 (Exascale,百亿亿级)计算时代门前的业内同仁,不论是来自最终用户、产品技术提供商还是研究机构,可能都在思考:高性能计算还会在哪些行业、哪些领域和场景引发创新的裂变反应?它达成E级算力并与AI和大数据实现了更为充分的融合后,又会带来哪些前所未有的可能?

图一 CCF HPC China 2021上的英特尔展位

这两个问题,或许每个专业人士的心里都有自己的答案,普通大众也会有自己的那份期盼,暂时让我们过滤掉这种多样性和复杂度,仅就刚才提到的医疗及生命科学领域做个展望。

1


更多疑难杂症将迎来

精准疗法或药物

上面这句话,就是高性能计算未来升级到E级计算时代,并与AI和大数据深度融合后,即将为这个领域带来的变化。

正如前文提到的,高性能计算已经显著缩短了新冠病毒分析和疫苗的研发时间,拯救了数亿普通人的生命。如果把它,特别是有了E级计算能力的它用于更为广泛的医疗细分领域,那么它又快又精准的效果,也会随之扩展到这些细分领域。

一个典型的例子就是美国著名影星安吉丽娜·朱莉,她有家族性乳腺癌史,在做了基因检测之后,结果显示她患乳腺癌的风险高达87%,于是她与医生商量后进行了预防性乳腺切除,把乳腺癌风险降低到了5%以下。

这种融合基因测序、分子诊断等手段、并由高性能计算加速的精准医疗方案,目前还只能惠及少部分人,主要原因就是高性能计算的整体算力还有所不足,无法为更多个体提供同样精准和快捷的服务。而且目前医学领域的基础研究与临床医学也处于分立的状态,这让很多基础研究偏离了解决实际需求的出发点,无法更高效地作用于医学的发展和进步。

于是,在高性能计算演进的同时,能更有效利用它的转化医学概念也被提出,它就是要把基础医学研究与临床实践更紧密地结合起来,通过多学科交叉合作实现“从实验室到临床”的双向且高效的转化。

在这个方向上,作为中国第一个,也是目前唯一建成的国家级综合性转化医学中心——上海交通大学附属瑞金医院转化医学中心很有发言权,其重点研究方向聚焦在肿瘤(包括白血病)、代谢性疾病和心脑血管疾病等领域,其实践过程就是需要收集全面多维的患者生物信息数据,然后基于海量数据的挖掘和分析,最终形成更个性化且精准的诊疗方案,然后再把这些方案涉及的新疗法和新药物普及开来。

这一过程说起来简单,但在落实时却十分复杂,仅在数据的收集、传输、存储和处理环节就面临重重困难,根本原因就是其涉及到本就庞大且还在持续增长的数据量。毕竟,单个人类全基因测序分析涉及的数据就高达870GB,再加上招募的患者病情通常比较危急,要求数据处理越快越好。另一方面,由于不同转化医学研究团队都需要同时访问海量数据库,所以,数据并行访问的性能,就与算力一起,成为了影响整体效率高下的关键。

为此,瑞金医院转化医学中心搭建了一个集存、传、算、用为一体的定制化超算平台,其中不但导入了英特尔至强可扩展处理器的强劲算力和高效算法来保障超算平台的计算性能,还使用了“英特尔傲腾持久内存+分布式异步对象存储 (DAOS)”的方案,来满足转化医学实时、高频和高效访问数据的需求。

图二 瑞金医院转化医学中心对DAOS优势的剖析

瑞金医院转化医学国家重大科技基础设施(上海)生信大数据平台共同负责人吕纲就在本次HPC China年会上表示:“DAOS充分发挥了英特尔傲腾持久内存的性能,提供了高带宽、低时延以及优异的小文件并发性能。对应全球IO500排行榜的公开数据,这将是生信领域第一个可以冲击榜单前十的系统,也是一个突破天花板的里程碑。”

吕纲在这里提到的英特尔傲腾持久内存,就是英特尔目前的高性能计算产品技术组合中的重要成员。它与DRAM相比,性能相近,但容量、耐用性和性价比更高,还有掉电不丢数据的独家本领。DAOS在软件上针对持久内存的特性做了优化,从而显著提升数据存储的访问效率。按吕纲的话说,就是:“以前做全基因组测序需要花近168小时,有了定制的生信计算平台,不到8小时就可以完成!这为挽救患者生命争取最佳治疗时机提供了保障。“

2


说E级盼E级,E级实现不容易

有了瑞金医院转化医学中心的开创性工作,并伴随更多转化医学中心的建立、运作和辐射,更多疾病,尤其是疑难杂症就有望获得更为精准的疗法和药物的支持,甚至被攻克。但这一愿景的落地,也离不开高性能计算的进一步发展演进。当然,高性能计算发展和演进惠及了很多行业。相信随着E级计算时代的到来,它必将在更多的行业中激发出更多让人意想不到的创新。

E级计算既然有这么大的价值,那还不废寝忘食、日以继夜地加速搞定?

这一点,可没有圈外人想象得那么简单。毕竟,它的算力水平,就是每秒钟要实现百亿亿次浮点运算。用一个形象但不够精确的方式来解释,它一瞬间的计算量,需要地球上的所有人持续不停地算上四年时间。

要实现如此级别的算力,现有的高性能计算技术必然要进行大的变革甚至是颠覆。而一个大家都已公认的方向,就是必须要导入基于异构架构的基础设施。

所谓异构架构,翻译成易懂的语言就是:CPU要有,GPU也要上,FPGA和ASIC(专用芯片)都有更好,总之……不论通用算力还是特定加速,一个都不能少!

英特尔近几年来被频频提及的XPU战略,就是这种异构架构创新方向的具体体现。

先说说这个架构中的CPU,它在未来的XPU时代大概率仍会扮演C位角色,算是通用算力的主要输出和整个平台的总控。例如今年刚刚发布的第三代英特尔至强可扩展处理器,就一方面借助创新内核架构、对最多40个内核和英特尔深度学习加速等技术的集成来实现通用算力,同时兼顾了对AI应用的加速。

来自实测的数据,证明这些技术的使用确实是立竿见影:与上一代相比,第三代至强可扩展处理器将金融领域的蒙特卡罗、布莱克-舒尔斯和二项式期权定价模型等应用的性能分别提升了高达70%、67%和28% ;将生命科学领域的NAMD、GROMACS、LAMMPS和 RELION的性能分别提升了高达57%、64%、60% 和 61%;将制造业中的 CONVERGE、NUMECA、OpenFOAM和Altair Radioss的性能分别提升了高达52%、61%、51%和47% 。而AI推理性能上,它相比前一代产品也提升了74%。

图三 英特尔高性能计算产品组合现阶段的核心——第三代至强可扩展处理器

另一方面,业内人士也非常看重第三代至强可扩展处理器在IO能力上的升级,特别是支持PCI-e 4这一进步,让它能与更多高性能 GPU 搭配。

下一代至强可扩展处理器 Sapphire Rapids 相比之下就更加让人期待:它将会采用全新模块化SoC架构,除了最多可支持 56个内核以及112线程外,它更吸引人的地方是一股脑导入了对DDR5、PCIe5 、CXL 和HBM技术的支持,可以进一步增强内存、存储和互连的性能,而且这款产品还会集成 AMX(高级矩阵扩展)技术,让CPU在运行矩阵运算任务时,拥有更显著的加速效果。

图四 英特尔公司副总裁 Trish Damkroger 展望下一代至强可扩展处理器的规格特性

与Sapphire Rapids主要提升通用计算性能相对应的,就是Ponte Vecchio将为高性能计算和人工智能带来的更强加速能力。根据Trish Damkroger的介绍,这款由47种不同芯片模块组合而成的英特尔GPU,将采用灵活的数据并行向量矩阵引擎来处理一系列高度并行的工作负载,以助力加速 E 级计算愿景的实现。它可提供超高的双精度浮点运算吞吐量并提供超高缓存和内存带宽,以满足需要高内存带宽的应用程序的需求。

图五 集领先架构和多种先进制造、封装技术于一身的Ponte Vecchio

异构架构虽然主要会落实在硬件上,但它并不只是硬件需要面对的机遇和挑战。“异构系统增加了对可扩展软件方法的需求,这种软件应该能在堆栈的不同层级工作,” Trish Damkroger指出,“英特尔推出了oneAPI 行业计划来帮助应对这一挑战。”

图六 英特尔在本次HPC China上分享的oneAPI技术演示

oneAPI为充分简化跨CPU、GPU、FPGA及其他加速器的异构计算应用开发及优化而生,肩负着推进和落实XPU战略的重任。它不仅能够提供编译器、库和分析工具,还支持AI和HPC应用加速的AMX、VNNI/DL Boost 指令和内存技术等功能。其目标,就是为更多相关应用负载提供更优的支持,并实现异构计算“一次编译,处处运行”。

图七 英特尔现在已大部分就绪,明后两年就会完全就绪的高性能计算产品组合

从硬件到软件再到产品组合,从计算到存储再到互联,英特尔向高性能计算市场交出的答案就是丰富、多维、软硬兼施的完整产品技术组合。至强是这一组合现阶段的核心,上文提及的oneAPI、傲腾持久内存和DAOS也同样是其不可或缺的部分。Sapphire Rapids和Ponte Vecchio则会为这个组合第一次带来“双主角”的配置。

不过更值得说明的是,不论是现阶段以CPU为主的组合,还是未来CPU与GPU协作的组合,英特尔提供这种组合,而非单独CPU支持的根本原因,都是要实现“均衡”。英特尔对这种均衡的解读,一是要实现数据全链路,包括计算、存储和传输的均衡提升和优化,以避免平台出现性能短板和瓶颈;二是要实现对通用计算和专用加速能力的兼顾和均衡提升,以满足高性能计算应用多样化+差异化+融合化的需求。而不论是这两种解读中的哪一种,目前整个业界几乎也只有英特尔具备足够的实力将之实现。

图八 英特尔在本次HPC China现场展示的部分高性能计算硬件产品 

3


高性能计算要持续创新:超级力量

和生态合作需并重

虽然Sapphire Rapids和Ponte Vecchio的指标非常诱人,但它肯定不是英特尔在高性能计算领域的创新终点。同样,尽管E级计算现在还是一个颇有难度的创新目标,但它也迟早会成为高性能计算创新史书上的里程碑之一。 

在它们达成之后技术和产业又会发生哪些新的变化,这才是大家目前更为好奇的话题。

虽然同样没有一个标准答案,但英特尔CEO帕特.基辛格最近提出的“四大超级技术力量”,或许可以帮我们拨开些许迷雾。“这四种超级力量分别是无处不在的计算、无处不在的连接、从云到边缘的基础设施,以及人工智能,”英特尔公司市场营销集团副总裁、中国区行业解决方案部总经理梁雅莉表示:“每一个超级力量都有其特质,同时也相得益彰,创造了强大的全新可能性。”

图九 英特尔公司市场营销集团副总裁、中国区行业解决方案部总经理梁雅莉

虽然提到可能性,就会有很多种可能,但梁雅莉还是锁定了一个重要的方向,即万物智能化,它是在万物数字化、万物网络化、万物移动化和万物云化基础上衍生出来的更大变革。“它将让人们对计算的需求呈指数级增长,”梁雅莉表示:“具备E级计算能力的高性能计算,就是支持这个转变的重要基础设施之一。”

图十 将赋能“万物智能化”变革的四大超级技术力量

赋能万物智能化的目标,肯定不是一家企业能够达成的愿景。就像在高性能计算领域不能只靠一个CPU或GPU,要凭产品组合打天下,在实现如此创新愿景的过程中,英特尔也在呼唤来自广泛生态系统合作伙伴的支持。

很明显,合作伙伴的响应很是积极——仅本次HPC China大会上,英特尔就联合十五家合作伙伴,展示了它们在高性能计算系统和解决方案上的最新成果,其中三家的实物展示还“嵌入”到了英特尔展区中,它们分别是新华三集团基于第三代英特尔至强可扩展处理器、英特尔傲腾持久内存、英特尔SSD Optimizer 存储构建的通用液冷服务器 H3C UniServer R4900 G5 以及整体液冷解决方案,联想基于第三代英特尔至强可扩展处理器的 ThinkSystem SD650 V2 温水水冷服务器,以及同样基于该款处理器的宝德HPC&AI集群解决方案。

图十一 H3C UniServer R4900 G5服务器不仅提升了服务器性能,也可有效减低噪音,助力“双碳”目标实现

图十二 联想ThinkSystem SD650 V2温水水冷服务器使用铜质水回路实现成本缩减和更高散热效率,能为要求严苛的 HPC 工作负载提供更可靠的支持

图十三 宝德 HPC & AI 集群解决方案能充分释放英特尔深度学习加速技术的潜能,助用户获得将HPC和AI有机融合的应用体验

4


写在最后

经过多年发展,高性能计算终于吹响了向E级计算时代冲刺的总攻号角,此为“势”正成。

英特尔与合作伙伴的关系更加密切、对创新的传递和放大更为明显,此为“道”已显。

英特尔高性能计算产品技术组合的成员越来越多维和丰富,搭配后还能带来更强的加成效果,此为“术”渐精。

这种道、术、势三合一带来的天时+地利+人和,就是英特尔持续发力高性能计算创新的底气所在。

同样,一场席卷全球的新冠肺炎,也为更多人接触、了解甚至是应用高性能计算带来了一个意料之外的契机,也让大家认识到,正是由于人类对于包括健康在内的更美好生活永不停歇的追求,才会对高性能计算不断提出更高的要求,同时也推动着高性能计算的普及。

当追求美好遇见勇于创新,会有怎样的化合作用?过去的,我们已经见证;未来的,让我们拭目以待。

本文由雷锋网原创。申请授权请回复“转载”,未经授权不得转载。


END

推荐阅读

逃离 AI 赛道的投资人:做局失利、破局无力

道的投资人:做局失利、破局无力



华为的「军团」组织模式:破茧重生,还是作死?






浏览 81
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报