收藏:详谈CPU处理器架构演进(Intel)
共 5632字,需浏览 12分钟
·
2021-04-23 23:37
来源:智能计算芯世界
服务器是CPU载体,其主板上数据传输流依次为CPU、内存、硬盘和网卡,针对图形加速等特殊场景增加了GPU 。数据经由网卡封装与解封、链路管理、数据编码与译码后,储存于外存硬盘为主 之中当程序需要执行时,将数据从外存经由一级存储器,传至CPU。其中一级存储器分为容量相对较大的主存储器(内存 DRAM )和容量较小但速度接近 CPU 的高速缓存。
CPU发挥“大脑”的功能,负责数据的处理和运算, CPU 与 GPU 、内存、硬盘和网卡间并不能直接通信,需要通过内存控制芯片、 PCIe 控制芯片和 I/O 处理芯片等实现,这类通信协调芯片构成主板上的“芯片组”,芯片组通过各类不同总线( PCIe 总线、 USB 总线和 SPI总线等)与 CPU 相连。如果说 CPU 是“大脑”、总线就是“神经结构”,芯片组就是“神经中枢”,决定了主板总线频率和带宽,以及扩展插槽和扩展接口的种类和数量。
围绕微架构和制造工艺CPU 本身 持续升级换代;同时由于 CPU 结构和功能设计影响芯片组的集成度和总线类型,CPU+ 芯片组 总线”构成“ CPU 平台升级”;平台升级带动服务器 主板和其他配件同步换代。
服务器 CPU 厂商 在新一代 CPU 正式发布之前 一般 提前 2 年左右将平台雏形、投放和测试性能以及样片给客户,做同步测试(兼容性和生态)和研发,确保芯片与使用该芯片的服务器同步上市。因而,除 CPU 和芯片组之外,还需要关注平台升级对其他服务器硬件的影响:
主板方面, 包括 PCIe 总线、内存、 GPU和 SSD。CPU 内部集成 PCIe 控制器和内存控制器, PCIe 总线点对点连接 CPU 与各类高速设备,包括 GPU 、 SSD 和网卡等,伴随 PCIe 升级至5.0 ,新一代 CPU 平台产品将兼容 PCIe5.0 标准,带动各类高速设备同步升级;而内存将从 DDR4 型号升级至DDR5,相关厂商或将逐步进入量产阶段。
配件方面, 包括电源和散热方案,主要原因是 CPU性能提升带来的功耗增加。
服务器CPU 架构包括 X86 、 ARM 和 MIPS 等, x86 为当前服务器 CPU 主流架构,几乎占据目前服务器全部市场份额,代表性厂商为 Intel 和 AMD 。国内方面,海光、兆芯和申威等也参与 X86 架构 CPU 的国产化替代,目前主要定位政务市场。短期来看, Intel 在服务器市场历史深厚,全球 CPU 市占率在95%左右。未来 2~3 年内, Intel 仍有望保持行业龙头的地位,因而围绕其 CPU 平台的升级仍是影响服务器硬件产业链周期性变化的关键因素。
Intel以 Xeon 为品牌名称持续推出系列产品,产品型号命名复杂且动态变化:
1、CPU+ 芯片组总线”构成不同的 CPU “平台”:如已经推出 Brickland 、 Grantley 、和Purley 平台,新一代 Whitley 和 Eagle Stream 预计将在 2020 年和 2021 年相继发布;
2、每一代平台产品具有多个子代,视 CPU 架构、工艺、 PCIe 控制器和内存控制器的不同 而有 差异:例如, 自 2017 年 7 月规模商用的 Purley 平台包括 SkyLake 和 CascadeLake两代,均采用 14nm 工艺最高 28 核心,但是支持的内存通道数从 6 通道升级至 8 通道,PCIe3. 0接口数增加。
3、不同平台的各个子代拥有多种型号 名称 2017 年 Purley 平台将产品型号 命名方式由此前连续使用四代的 E7、E5 变为“ 至强可扩展处理器(Intel Xeon Scalable Processor系列型号)按 铂金(Platinum)、金(Gold)、银 (Silver)、铜(Bronze)定义 。
从Tick Tock 到 PAO Intel CPU 升级按照 2~3 年周期持续向前推进:
2006 年, Intel 借意钟摆摆动周期提出“钟摆战略(Tick Tock Tick 年(大年)改制程 工艺 Tock 年(小年)改 架构,按照两年的周期交替推进产品升级,该模式下 Intel成功推进了 22nm~14nm 系列芯片的迭代。
2016 年, Intel 终止“ Tick Tock ”转而采用“制程架构 优化”( PAO )战略 P Process年改工艺,Architecture)年改架构Optimization )年优化,按照三年的周期交替推进产品升级。背后原因主要在于芯片制造工艺升级的进度放缓。
新一代产品升级会带动CPU 性能提升一倍,价格增长 20%~30% 。CPU 由运算器、控制器和寄存器组成 ,在服务器中性能最重要,成本也最高,视不同参数而异,均价在 1500 元 片,占服务器硬件成本的 20% 以上。一个 CPU 可 以封装多个处理器内核, 称为“多核并行”, 多核 CPU 既可以提高运算性能,又可以延长服务器生命周期。
接下来,重点从Intel 处理器架构的演进史来看看CPU架构发展。
P6是 Intel 的第六代微架构,最早用于1995年的 Pentium Pro 处理器,后面 2000 的 NetBurst 感觉应该也算是包含在 P6 这个大系列里面,一直到 2006 年为止。
这个横跨了将近 10 年的架构系列最早是 600nm 的工艺,一直到最后达到了 65nm,算是不断摸索完善出来的,也是 Intel 走上比较规则的架构发展之路的一个起点。
预测执行(Speculation)和乱序执行 14 级流水线,第一代奔腾的流水线只有 5 级,P6 的 14 级在当时是最深的 片内的 L2 cache 物理地址扩展,达到最大 36 位,理论上这个位宽最大可以支持到 64G 的内存(虽然制程的地址空间还是只能用到 4G) 寄存器重命名 MMX 和 SSE 指令集扩展,开始 SIMD 的思路了
以上这些都是现代处理器中非常重要的设计。更重要的是从这里开始,奠定了 Intel 沿着摩尔定律发展的 Tick-Tock 架构演进道路:
Tick 改进制程工艺,微架构基本不做大改,重点在把晶体管的工艺水平往上提升 Tock 改进微架构设计,保持工艺水平不变,重点在用更复杂、更高级的架构设计
然后就是一代 Tick 再一代 Tock,交替演进。P6 的末尾阶段,首次出现了双核,当时的双核还是基本上像是把两个单核用胶水粘在一起的感觉。
Core 从 65nm 改到 45nm 之后,基于 45nm 又推出了新一代架构叫 Nehalem,这一代的提升引入了相当多的新技术,算是个非常重要的里程碑。
32nm 的下一代 Tock 是 Sandy Bridge,二代 Core i 系列以及第一代 Xeon E3、E5 系列也基于这个架构:
Intel Turbo Boost 2.0 增大了 L1 和 L2 cache 共享的 L3 cache 也同时支持片上的核芯显卡 IMC 强化成了 GMCH(integrated graphics and memory controller),片上显卡共用主存作为它的显存 每个核上的运算部件增强 分支预测增强 微操作译码部分新增了一个 cache(uop cache) 14 到 19 级指令流水线!!!(长度区别基于上面那个 uop cache 是否命中) 多个核间、核芯显卡、cache 间用了环状总线(ring bus) Intel Quick Sync Video,支持视频的硬解码 其他指令扩展升级等等
Tick 到 22nm 的下一代架构叫 Ivy Bridge,三代 Core i 系列和二代 Xeon E 系列:
16 位浮点指令 片内硬件随机数生成器 PCIE 3.0 其他各个部分都做了很多提升
22nm 的 Tock 到了 Haswell,四代 Core i 系列和三代 Xeon E 系列:
每个核内的部分进一步升级,更多的 ALU、各种带宽增加等等 支持 DDR4 内存 提供部分雷电接口(Thunderbolt)支持 完整集成电压调节器(FIVR),把主板上的一部分电源控制做到了片内 更高级的功耗控制系统,增加了 L6 和 L7 两级 CPU 睡眠状态 其他指令扩展升级等等
14nm 的 Tick 到了 Broadwell,五代 Core i 系列和四代 Xeon E 系列。各种指令集升级、支持了很多新功能特性。14nm 的 Tock 到了 Skylake,进入 XXlake 时代,六代 Core i 系列。
Skylake 的第五代 Xeon 摆脱了原本的系列名,而是重新改成了 Bronze、Silver、Gold、Platinum 4 个系列。
最新一代 Intel Xeon Cooperlake 10nm 工艺为 56 核心,使用周期为 3 年以上。下一代核心数和单核心性能有望同步跃升,带动价格上行。虽然考虑到兼容性问题,新产品上市后老产品仍会存在一定时间,且迎来降价,但新产品爬坡进度较快,甚至有望在一年内达到 50% 以上,而老产品逐步退场。事实上,从Intel 数据中心( DCG )业务收入 来看,新产品上市会带动相关业务持续 2~3 个季度的高增长。
受益于CPU 升级换代,服务器需求量有望迎来增长。主要是新平台上市前,下游厂商会部分延缓采购需求,而等到新平台上市后,将前期压抑的需求释放出来。在数据指标上,受产品出货顺序的影响, CPU 是服务器上游元器件,因而最先反映服务器市场需求情况, IntelDCG 业务增速 成为 行业景气度先验指标,大概提前 4~5 个季度 。
2019 年上半年连续两个季度负增长后 Q3 开始出现回升 ,连续Q3和Q4两个季度增长,预示下游服务器需求企稳回升。
服务器需求量增长带动CPU 出货量提升,且增速高于服务器 出货 增速。单台 服务器 按性能需求 可以使用多个 CPU ,一个 CPU 称为单路,两个 CPU 称为双路。目前广泛使用的均为双路服务器,而四路、六路及以上服务器也有特定的应用场景。
一般而言,八路及以下服务器为普通机, 16 路及以上服务器为小型机,大型机则一般以定制化独立封闭系统为主。总体看,目前服务器市场以双路服务器为主,根据 ZDC 数据显示, 2018 年双路服务器受到47%的关注,四路服务器受到 29% 的关注。随着云计算大数据的普及,四路服务器展现出较广阔的市场空间,具体应用领域有 ERP 系统、商业智能分析和虚拟化应用等。
量价齐升,Intel 数据中心( DCG )业务回暖迹象明显 从以往来看, 新产品上市会带动 DCG业务持续 2~3 个季度的高增长 2020 年及 2021年 Intel Whitley 和 Eagle Stream 陆续上市, DCG 业务有望迎来 新一轮高增长。Intel 产品主要覆盖 PC 、数据中心、物联网、存储器和编程五大板块。
Grantley 平台于 2013 年底发布,带动 Intel DCG 收入增速自 2014 年 Q1 开始回暖向上,2014 年 Q2、Q3 和 Q4连读3个季度增速 27、27% 和37%。
Purley 平台于 2017 年 7 月发布,带动 Intel DCG 收入增速自 2017 年 Q4 开始回暖向上,2018年 Q2和 Q3分别带到24% 和 30% 的高增长。
新一代 Whitley 平台 Ice L ake 将于 2020 年 9 月推出 (根据 Intel 路线规划图),采用全新架构和10nm 制程 工艺 ,以及 PCIe 标准和内存控制标准的同步升级,有望带动 IntelDCG 业务新一轮高增长。
服务器芯片制造工艺已经从 2017 年普遍使用的 14nm 工艺向10nm 和 7nm 演进。芯片制造包括 IDM Integrated Device Manufacture )和 Foundary 代工厂两种模式, IDM 厂商如 Intel 和三星等, Foundary 厂商如台积电和格芯等 但是主要参与者在工艺进度上存在差距。
从目前主流制造厂进度看, Intel 服务器 CPU 还停留在 14nm工艺,核心看点是 2020 年秋季发布的 Ice Lake Whitley 平台) 10nm 工艺以及 2021 年初Sapphire Rapids Eagl e Stream 平台) 7nm 工艺。相较之下,竞争对手 AMD 已经在 2019年 Q4 的 Rome 系列使用 7nm 工艺,代工厂为台积电。格芯于 2012 年从 ADM 拆分而来,目前在工艺制程上相对落后。
报告下载:CPU和GPU研究框架合集
原文链接:英特尔CPU处理器和架构演进(附下载)
相关阅读:英伟达GPU技术和架构演进(附白皮书)
转载申明:转载本号文章请注明作者和来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。
推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包”相关电子书(35本技术资料打包汇总详情可通过“阅读原文”获取)。
全店内容持续更新,现下单“全店铺技术资料打包(全)”,后续可享全店内容更新“免费”赠阅,价格仅收188元(原总价290元)。
温馨提示:
扫描二维码关注公众号,点击阅读原文链接获取“架构师技术全店资料打包汇总(全)”电子书资料详情。