摩尔线程:新一代国产GPU浅析
3月30日,摩尔线程举行主题为“元动力 创无限”的春季发布会。摩尔线程创始人兼CEO张建中解读了“元计算”这一产业趋势,并表示:“元计算时代已然开启,多功能GPU是元计算的算力基础设施,也是我们创新的原点。元计算是支撑包括元宇宙在内的下一代互联网应用的通用算力平台,以图形计算和AI计算为基石,是物理世界数字化和数字世界物理化的底层算力支撑,将为数字经济开辟更广阔的发展空间。”
在此次春季发布会上,摩尔线程发布第一代MUSA系统架构GPU。据介绍,MUSA是摩尔线程产品系列采用的统一系统架构,包括统一的编程模型、软件运行库、驱动程序框架、指令集架构和芯片架构。开发者基于MUSA开发的应用将具备广泛的可移植性,可以同时运行在云端和边缘的众多计算平台上,包括面向图形、计算、多媒体和人工智能的各类产品线。
苏堤是基于MUSA统一系统架构打造的第一代摩尔线程多功能GPU芯片产品。该芯片内置现代图形渲染引擎、智能多媒体引擎、AI计算加速引擎、物理仿真及科学计算四大引擎,旨在以先进的现代GPU架构、广泛的平台通用性和全栈计算能力,充分满足数字经济云边端多元算力需求。至此,摩尔线程成为目前中国市场率先进行多功能GPU研发设计、并能以极快速度实现GPU量产交付的公司。
在发布会上,摩尔线程还同时发布了多款重磅新品,包括面向PC和工作站的桌面级显卡MTT S60和专为数据中心打造的图形渲染和计算卡 MTT S2000;GPU物理引擎AlphaCore ;DIGITALME数字人解决方案;及助力数字经济发展的多个元计算应用解决方案。
MTT S60
面向PC和工作站的桌面级显卡
MTT S60是摩尔线程首款突破性多功能智能显卡,主要面向PC和工作站 。MTT S60是基于MUSA统一系统架构GPU苏堤核心晶片制成,采用12nm制程,包含2048个MUSA核心,单精度算力最高可达6TFlops,配置8GB显存,基于MUSA软件运行库和驱动程序等软件工具,MTT S60显卡能够在不同应用场景中展现多重优势。
广泛的生态平台支持:MTT S60显卡支持包括英特尔、AMD、飞腾、龙芯、兆芯、海光在内的各型CPU平台,同时支持Windows 10、麒麟、统信及多种Linux操作系统。MTT S60显卡凭借其领先的现代GPU架构、平台通用性和对新兴CPU及操作系统的支持,将极大推动中国数字化基础建设。
丰富的图形API接口:MTT S60显卡支持DirectX、Vulkan、OpenGL和OpenGL ES等众多图形API接口,可满足GIS、BIM、设计、主流游戏、原生Android、三维渲染等应用对图形性能的需求。
通用AI功能支持:基于全栈功能GPU的通用计算能力,MTT S60显卡能够加速DBNet、CRNN、Yolo、Restnet50/101等广泛的AI模型推理计算,支持OCR、图像处理和视频增强等多种复杂人工智能场景。由此,能够释放强大的AI能力,加速普及PC级AI应用。
领先的硬件视频编解码能力:MTT S60显卡不仅支持主流的H.264和H.265编码格式,还领先行业同类产品,提供了对AV1视频格式的硬件编码支持,能够帮助企业及机构降低视频处理成本;而在硬件解码方面,MTT S60显卡则支持 AV1、H.264、H.265等诸多格式的硬件解码。借助强大的视频编解码能力,搭载摩尔线程MTT S60显卡的计算机能在影音娱乐、视频监控、视频剪辑等应用中降低CPU负载,提升计算机整体效能和性能。
最高可达8K的高规格显示输出:MTT S60显卡提供3个DisplayPort 1.4规格接口,支持8K/4K 画面显示,可满足大屏高解析度的娱乐及工作需求。
8GB大容量显存:MTT S60显卡搭载8GB 低功耗LPDDR4x显存;由于支持多种纹理压缩算法,显存带宽的利用率也得以显著提高,使得MTT S60显卡能在复杂模型设计、高清视频处理以及大AI模型等高负载应用中提供更高的显存带宽利用率,发挥更大效能。
PES控制中心:MTT S60显卡为用户提供了一站式的图形化管理控制中心。借助该工具,用户不仅可监控GPU运行状态并进行相关的2D/3D图像输出设定,更可提供无需人工干预的显卡驱动更新等功能,使显卡能够在不同应用环境中获得持续的优化和兼容性改善。
生态协作始终是推动产业和体验升级的关键所在。目前,摩尔线程MTT S60支持英特尔、AMD、龙芯、飞腾、兆芯等主流CPU以及Windows、麒麟、统信、Ubuntu等操作系统,并且已经着手与众多PC合作伙伴开展合作,包括联想、浪潮、清华同方、长城超云等(排名不分先后)。
此外,摩尔线程还发起并携手众多行业合作伙伴共建中国“完美体验系统联盟(PES联盟)”,旨在通过产品规划、研发、最终生产阶段的协同合作,聚焦统一标准、整合资源、分享技术等,为生态伙伴创造更多价值,为终端用户打造完美体验。
MTT S2000
专为数据中心打造多功能GPU
MTT S2000是摩尔线程基于MUSA统一系统架构苏堤核心晶片打造的数据中心级多功能GPU产品。MTT S2000内置渲染、音视频编解码、人工智能加速和并行计算等硬件模块,能够提供图形图像渲染、视频云处理、AI和科学计算在内的全栈功能。凭借其独特的渲染、虚拟化等能力和广泛的生态支持,MTT S2000可以在云桌面、安卓云游戏、视频云、云渲染和AI推理计算加速等应用场景全面助力绿色数字经济发展。
MTT S2000采用12nm制程,使用4096个MUSA核心,最大配置32GB显存,单精度算力最高可达到12TFlops,支持H.264、H.265、AV1多路高清视频编解码,以及广泛的AI模型算法加速。MTT S2000采用被动散热、单槽设计,满足数据中心高密度GPU配置方式。
为提升MUSA架构产品在实际生产环境中的表现,摩尔线程还为MTT S2000系列产品推出了针对硬件架构进行专门优化的统一编程模型、运行库、驱动等软件工具,可方便开发人员完成应用的移植和适配,充分调用MTT S2000的硬件资源和算力。MTT S2000支持OpenGL、OpenGL ES、DirectX、Vulkan等图形API;通过FFMPEG和VA-API/DXVA等兼容支持音视频处理生态;并通过OpenCL及Vulkan满足AI和科学计算的程序兼容。
加速PC云桌面:摩尔线程MUSA架构所采用的MT Mesh 1.0 GPU虚拟化技术使MTT S2000能够在虚拟化架构中获得更高的性能和效率。MTT S2000是国内率先基于硬件的GPU 虚拟化解决方案,以行业标准SR-IOV(单根I/O 虚拟化)技术为基础,实现每个物理GPU 上容纳多个虚拟化用户远程工作。
MTT S2000虚拟化技术将极大地促进云桌面用户体验提升。用户既可以按照传统GPU直通式方案,将一个GPU与单个虚拟机进行绑定以获得单应用的最大性能;也可通过GPU虚拟化的方式将GPU分配给众多虚拟机,以实现尽可能高的算力资源使用率。同时,在虚拟机中,摩尔线程提供了对Windows和Linux操作系统的同时支持,并兼容DirectX、OpenGL、Vulkan等渲染API,保证了用户应用程序的兼容性。同时,借助摩尔线程DirectStream技术,MTT S2000可以一体化更快速完成渲染编码,以及并发支持多路的视频编码,有效降低CPU负载和系统时延。
原生Android云游戏加速:MTT S2000支持ARM架构,并支持鲲鹏、安培、飞腾等CPU的服务器产品。MTT S2000直接提供对OpenGL ES接口的原生支持,并支持ETC/ETC2/ASTC/S3TC等纹理材质的硬件处理,这使得MTT S2000显存带宽的使用效率能够获得2.4倍提升,从而让摩尔线程GPU在云手机和云游戏中展现出更好的渲染效率。同时MTT S2000还搭载了摩尔线程第一代安卓云加速平台(Android Cloud Accelerator,ACX),通过安卓驱动透传和GPU硬件编码大幅提升了安卓云手机、云游戏应用的计算效率并极大提高了安卓系统兼容性。
加速视频云计算:基于独立的硬件编码器和解码器,MTT S2000能够完成多路并发的硬件编解码,大幅提升视频云的计算效能。在格式支持方面,MTT S2000不仅能够实现H.264和H.265等视频格式的硬件编码,更率先提供了对下一代编码标准AV1的硬件支持。在解码方式方面,MTT S2000则能够对H.264、H.265、AV1、VP9/VP8等格式提供硬件支持,在云端视频转码、视频压缩、网络视频、直播、远程会议、监控等行业有着极广的适用范围。
云端Unreal/Unity应用渲染:MTT S2000针对Unreal和Unity等应用渲染框架,在驱动上进行了深度适配和优化,以保证充分发挥GPU内部的硬件能力。无论是传统渲染框架的渲染,还是AI辅助的渲染,摩尔线程全栈功能的GPU都能够予以支持和加速。
加速AI计算:得益于丰富的模型库支持和先进硬件设计,MTT S2000能够满足计算机视觉、自然语言处理等多种智能应用场景的模型训练和推理应用,并对包括DBNet、CRNN、FastRCNN、Yolo V2/V3/V5、PSENet、Mask RCNN、Resnet 50/101、Inception、Vgg、Alexnet、Densenet、Unet等在内的众多主流深度学习算法提供支持。同时,MTT S2000也支持用户使用PyTorch、TensorFlow、PaddlePaddle等深度学习框架进行算法开发及应用搭建。此外,用户也可通过应用更广泛的OpenCL及CUDA环境进行开发,大幅降低了新硬件的学习及应用门槛,提升开发速度。
摩尔线程MTT S2000兼容X86、ARM等CPU架构以及主流Linux操作系统发行版,并已着手与多家服务器合作伙伴开展合作,包括浪潮、新华三、联想、清华同方、长城超云、思腾合力(排名不分先后)等OEM厂商的多款通用服务器及GPU服务器型号,可以在众多硬件和应用环境中完成部署。
AlphaCore
下一代多平台GPU物理引擎
AlphaCore 是由摩尔线程独立设计研发的下一代多平台GPU物理仿真系统,能够对物理世界中复杂的固体、柔性体、流体等效果进行超高精度的物理仿真处理,通过运算模拟,让布料、毛发和数字角色软体肌肉组织的物理交互效果达到电影级别般真实。
AlphaCore 物理引擎凭借强大的材料力学模块,可以实现丰富的材料交互动态效果,例如:弹塑性材料、各项异性材料、羽绒服、皮革、丝绸、绵纶等。基于AlphaCore开发的系列工具包括:布料毛发制作工具——VeraFiber;气体流体仿真工具——Catalyst;以及生物仿生计算工具——Bionics。对比Houdini Vellum 的软体毛发布料和PyroFX 的烟火流体, AlphaCore 均有 5~10倍的性能提升。
同时,AlphaCore也提供了多平台兼容版本,以最大程度兼容现有生态中的Vulkan、CUDA、DirectX等 Runtime API环境,及Houdini,Unreal,Unity和D5游戏引擎和设计软件,广泛覆盖影视后期制作、动画、游戏、建筑表现等领域的实际应用场景。
结束语:摩尔线程基于其MUSA架构多功能GPU的丰富应用,覆盖数字办公、影音娱乐、工业和建筑设计、地理信息系统、云桌面、云游戏等多个场景。基于摩尔线程多功能GPU的核心算力,面向复杂的实际应用场景,摩尔线程正携手诸多合作伙伴打造各行业元计算解决方案,以算力支撑为数字经济的加速发展贡献力量。
参考来源:网络、EETOP等
转载申明:转载本号文章请注明作者和来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。
推荐阅读
更多架构相关技术总结请参考“架构师全店铺技术资料打包”相关电子书(37本技术资料打包汇总详情可通过“阅读原文”获取)。
内容持续更新,现下单“全店铺技术资料打包(全)”,后续可享全店更新“免费”赠阅,价格仅收198元(原总价350元)。
温馨提示:
扫描二维码关注公众号,点击阅读原文链接获取“IT技术全店资料打包汇总(全)”电子书资料详情。