英特尔陈小波: 克服瓶颈,加速你的混合云
近年来,国内云计算市场发展进入成熟期,与国外专注将更多公有云能力部署到私有云方向不同,企业更加关注公有云和私有云协同使用,将更多规模化应用投向混合云架构。
2022分布式存储线上峰会下午的混合云数据管理论坛上,英特尔®傲腾™事业部解决方案架构师陈小波指出混合云作为当前用户常用的IT基础架构,正在面临成本与性能双重挑战,而英特尔®傲腾™技术基于傲腾持久内存与固态盘为加速混合云而生,是助力用户克服瓶颈的不二法门。
混合云端的成本与性能挑战
AI、5G、物联网等新技术不断融入的新兴应用如雨后春笋般涌现,企业用户在混合云上运行的应用不乏如AI等新兴应用。不论是针对数据指数级增长还是新兴应用必要的强大算力,我们都需要更多内存让应用跑得畅快,但囿于DDR4内存成本“高贵”问题而迟滞不前。
另一个挑战是更高性能,需要更高的IOPS,用全闪超融合可以解决,但解决方案还要面临一个新问题,因为沿着摩尔定律的趋势我们会得到更高的容量,以及越来越低的耐用性,所以确保固态盘的耐用性是个大麻烦。
陈小波基于这些挑战分别给出了两个基于英特尔®傲腾™技术的解决方案。首先是傲腾持久内存,长得像DDR4内存条,采用了标准的DDR4外形规格和接口与协议,能兼容现有的DDR4插槽,傲腾持久内存包括两个工作模式——Memory Mode和AD Mode(App Direct)。
Memory模式大家更加熟悉,用DDR4作为英特尔®傲腾™持久内存的缓存,从处理器角度看,DDR4相当于一个性能层,英特尔®傲腾™持久内存则在其中充当大容量低成本的容量层,处理器先把最热最常用的数据放到缓存层DDR4中,如上图左边的存储金字塔。傲腾持久内存可存放的数据热度稍差,但也离CPU很近,响应时间和性能上都可以说是较通用存储快上百倍的内存数据存储层。
目前最快的DDR4频率是3200MHz,傲腾持久内存也是3200,拥有128GB、256GB、512GB三种不同规格,支持和DRAM缓存一起协同工作,最大程度提升企业成本效益。
VMware如何支持英特尔®傲腾™持久内存?
应用方面,陈小波以VMware为例,具体介绍了傲腾持久性内存如何与其它应用结合,还有增加了持久性内存的全新设备配置攻略。
VMware支持英特尔®傲腾™持久内存近三年时间,从vSphere7.0 U3c开始,完全支持傲腾持久内存的Memory Mode,还直接结合自身部署应用监控的实际情况发布了配置指南。
这个数字化呈现应用情况的监控工具就是VMware的vMMR,能准确了解数据在不同DDR4和PMem(傲腾持久内存)上的带宽应用。就是构建两个vSphere集群,其中一个只用DDR4内存,另一个集群是DDR4+PMem,通过vMMR就可以直接监控运行应用在DDR4上的内存带宽吞吐量,以及在PMem上的带宽,如果带宽消耗过大,就要将它迁移到DDR4集群上,其它情况则是DDR4+PMem占优,有了这个工具就能让用户透明化监测应用情况。
除了有效监控,还要合理利用限制条件。vSphere7.0 U3c的限制条件首先是每个插槽至少要4根英特尔®傲腾™持久内存条,而DDR4容量至少是PMem容量的八分之一,VMware的推荐容量配比达到四分之一。
以容量最小的128GB PMem为例。每个插槽要4根傲腾持久内存条,2个插槽需要8根,内存容量达到1TB,如果按DDR4八分之一的容量配比,就是需要8根16GB DDR4内存条。而达到VMware推荐的25%,就需要16根16GB的内存条,分别叫做8-4和4-4配置。
还有2020年,VMware推出的vSphere CPU认证限制,一个CPU的认证限制在32个物理核,服务器物理成本可以直接计算,但用户还需要更多的核芯和内存,尤其是新兴应用,如何充分利用VMware的这个限制,实现最大限度优化采购成本要划重点。
通过英特尔®傲腾™持久内存可以获得1TB甚至2TB的高内存容量,充分使用CPU更多的核芯,vSphere认证费用才算真正的物有所值。
陈小波提供的推荐配置,在新的Ice Lake平台上,常用的是24核配置,按传统1:2、1:4的内存配比可能会得到384GB的内存。推荐配置的是32核,榨干认证费价值,32核CPU需要更多内存,采用Memory Mode的DDR4+PMem模式,8+4的配置,实现整体性能提升33%,内存容量提升160%,存储容量提升200%,真正释放应用潜力。
以下为vSphere7.0 U3c的工作原理呈现
vSphere安装之后,配合vMMR大家可以在界面上看到之前提到的1TB内存的使用情况,配置是1TB的PMem和256GB的DDR4,DDR4缓存看不到,可见可用的容量由1TB的PMem提供。
在Moniter模块里,Performance-Overview里提供了四个数据,其中三个非常关键,Memory Utillzation,代表你用了多少容量,通过这个模块可以明显看出不同颜色的DDR4和PMem各自被消耗了多少,Memory Bandwidth(带宽)是看DDR4和PMem的带宽消耗。Memory Miss Rate(失误率)则是看DDR4的芯片密度。
除了监控信息,还有告警信息提示很重要,告警太多就证明运行的应用非常吃内存带宽,应该重新合理规划整个集群。
耐用性保障——英特尔®傲腾™固态盘P5800X
我们知道,固态盘的寿命取决于写入次数,P5800X有100的DWPD(硬盘每天写入次数),陈小波在演讲中表示,性能越来越强大是必然,但英特尔®傲腾™固态盘还可以保持耐用性是关键。在全闪解决方案中,相当于是让固态盘在容量不断加成的基础上套上一层坚固的铠甲,提升盘的使用寿命。
他用英特尔®傲腾™固态盘做全闪超融合的缓存盘来说明,左图是4个P4510做8KB的随机写入,在测试过程中,每个P4510都有约12500的IOPS,如果要改成64KB,相当于随机写要修改12500次,战损飞快,这种是没有缓存盘,P4510都是数据盘的情况。
右图则是在4块P4510基础上增加了2块傲腾固态盘,即P4800X,之后P4510四块盘的IOPS变得非常低,偶尔有超过一万。其中,傲腾固态盘承担了每秒4万的8KB随机写入,同时将它们合并为200多KB的顺序写,每隔一段时间把这些顺序写刷到两块P4510盘上去,间隔一段时间刷一次,偶尔刷高一点是每秒1万,刷低一点可能每秒五千,中间大量的时间P4510盘没有IO,整个P4510盘的寿命因此提升了10倍以上。
P4510的DWPD是1,未来固态盘的耐用性一定会进一步降低,也就是说有了傲腾固态盘,用户是可以放开使用DWPD是0.3或0.5的盘做数据盘的。
总结
英特尔®傲腾™持久内存解决了虚机的密度提升问题,让用户拥有更低成本的大内存容量,傲腾固态盘则是解决了全闪存解决方案的耐用性问题,两者各司其职都在持续为用户的混合云应用提供更强的动力,同时也在推动傲腾技术作为支撑的应用不断增加。倒是不知道傲腾持久内存里的另一个AD模式开启会是什么作用,观察中。
点击 阅读原文 可观看由英特尔陈小波带来的精彩演讲:克服瓶颈,加速你的混合云