高性能计算云(HPC Cloud)白皮书

架构师技术联盟

共 2773字,需浏览 6分钟

 ·

2021-10-09 06:07



2021年9月23日,超级计算创新联盟2020-2021年度全体会议在甘肃兰州召开。作为工作组2021年度重要成果,《高性能计算云(HPC Cloud)白皮书》(以下简称“白皮书”)正式发布。


下载链接:

高性能计算云(HPC Cloud)白皮书

网盘链接:

关注微信号,回复“HPC-Cloud”获取下载链接



作为高性能计算云领域首个白皮书,《高性能计算云(HPC Cloud)白皮书》由中国信通院牵头,联合高性能计算云工作组成员单位共同发起,并积极开展研制工作。


白皮书首次明确了高性能计算云的基本概念与内涵:高性能计算云是一种结合云计算技术的高性能计算服务模式,其中高性能计算是服务核心,云计算是服务模式创新的技术手段,多云互联是服务能力的扩展支撑。在此基础上,高性能计算云将与大数据、人工智能等技术深度融合,面向行业应用需求,提供一体化智算服务能力,实现高性能计算云能力拓展。


白皮书根据产品形态将高性能计算云分为三类:以超算资源为底座,通过云计算的服务模式为用户提供高性能计算服务的超算云;以通用云资源作为底座,为不同租户提供高性能计算服务的云超算;在不同高性能计算云之间,实现资源、数据、应用、服务等不同维度的云间协同与统一多云管理的多云互联。



白皮书首次提出了高性能计算云参考架构。作为结合超算云、云超算以及多云互联核心能力的综合性架构,该架构所包含的各项能力,既有现阶段超算云与云超算的共性能力,也有现阶段超算云与云超算的特性能力。未来,超算云与云超算将沿各自的技术路线演进发展。


高性能计算云是一种结合云计算技术的高性能计算服务模式,其中高性能计算是服务核心,云计算是服务模式创新的技术手段,多云互联是服务能力的扩展支撑。在此基础上,高性能计算云将与大数据、人工智能等技术深度融合,面向行业应用需求,提供一体化智算服务能力,实现高性能计算云能力拓展。



基础设施层∶提供行业高性能计算应用所必须的计算、存储与网络资源。


  • 平台层∶向下对高性能算力资源解耦,向上提供部署运行高性能应用的相关平台环境。

  • 服务层∶面向行业高性能应用提供统一的高性能计算云服务平台,满足行业应用差异化、定制化服务需求。

  • 运维管理与安全防护∶针对高性能计算云不同的层次,提供资源监控、告警监控等运维管理服务以及数据、接口等安全防护服务。

  • 高性能计算多云互联与管理∶从资源、数据、应用、服务等不同维度实现高性能计算云之间的互联互通,并在此基础上实现统一的多云管理。


目前,高性能计算云产业根据产品形态将高性能计算云分为三类

  • (1)超算云∶超算资源为底座,通过云计算的服务模式为用户提供高性能计算服务。
  • (2) 云超算;以通用云资源作为底座,为不同租户提供高性能计算服务。
  • (3)多云互联∶在不同高性能计算云之间,实现资源、数据、应用、服务等不同维度的云间协同与统一的多云管理。

超算云和云超算两类产品在高性能计算云参考模型的基础设施、平台和服务方面具有不同的特征。本章节将针对高性能计算云不同产品形态进行详细介绍。



与传统超算对比,云超算在建设方式、服务提供形态等方面具有一定的优势。云超算是基于云原生技术,采用公有云或混合云模式为用户提供的高性能计算服务。云超算具备开箱即用、按需购买使用、资源种类多样、弹性扩展、易用易管理、安全可信和连通性好等优势和特点。云超算是传统HPC的软硬件与云原生、AI等技术结合的新型高性能计算服务模式。


多云互联是一种云应用策略,通过多云连接策略,企业可连接多个私有云、公有云及混合云平台,将日常业务灵活地分布至不同的云端环境。



企业可利用不同云服务供货商的服务优点,选取最合适的云服务组合,同时减低采用单一云服务平台的风险。根据互联的主体不同,可以将多云互联划分为以下三个方∶


  • HPC公有云互联∶ HPC公有云之间的互联互通,包括但不限于基于云化的超算中心互联、云超算互联、超算资源与云资源互联等。

  • HPC公有云与HPC私有云互联∶HPC公有云与HPC私有云之间的互联互通。部分企业从生产数据安全的角度出发,将敏感数据使用自建 HPC 私有云处理,并将脱敏后的数据发送至HPC公有云协同处理。

  • 云边互联∶HPC公有云与HPC边缘云之间的互联互通。为了满足近用户侧的高效算力需求,可以利用HPC边缘云所提供的高性能计算资源执行对业务实时性要求更高的部分业务
流程(如AI推理过程),算力资源更加丰富的 HPC公有云执行对算力要求更高的业务流程(如AI训练过程),云边之间
通过互联互通实现相互协作。


根据Gartner的研究数据显示,受疫情影响,全球云计算市场的增速放缓至13.1%,市场规模为 2083亿美元,其中IaaS市场规模为592亿美元,PaaS市场规模为 463亿美元,SaaS市场规模为1028亿美元。



预计到 2024年,高性能计算云的市场规模将达到 88亿美元,市场增速将是线下高性能计算市场规模的2.5倍,2019年至2024年的CAGR 为17.6%。


预期到 2024年,高性能计算总体市场规模将达到470 亿美元,其中高性能计算云在高性能计算总体的市场规模的占比将达到18.7%,位列第二,仅次于服务器市场规模。


此外,白皮书围绕全球市场、应用上云、技术融合三个方面,梳理了高性能计算云的产业发展现状;针对能源勘探、工业仿真、多媒体、生命科学、气象环保、材料研发等应用场景,分析不同场景需求,并阐述不同应用场景下的高性能计算云典型案例;从计算业务上云、一体化安全防护体系、计算软件服务化、绿色节能等不同方面,展望高性能计算云技术与产业发展趋势。


来源:超级计算创新联盟


下载链接:

高性能计算云(HPC Cloud)白皮书

阿里云弹性高性能计算

中国高性能计算挑战与进展

高性能深度学习计算框架

超级计算机研究报告

深度报告:GPU研究框架

《高性能计算和超算专题》
《基于GPU加速和高性能计算专题》
2021中国智能网卡分享(上)
2021中国智能网卡分享(下)

来源:智能计算芯世界




转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。


推荐阅读

更多架构相关技术知识总结请参考“架构师全店铺技术资料打包”相关电子书(37本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新,现下单“全店铺技术资料打包(全)”,后续可享全店内容更新“免费”赠阅,价格仅收198元(原总价350元)。



温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情


浏览 98
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报