中国FPGA芯片行业研究报告(上篇)

智能计算芯世界

共 4709字,需浏览 10分钟

 ·

2021-08-19 17:02



AI芯片主要分为CPU 、GPU、FPGA以及ASIC。其中以CPU、GPU、FPGA、ASIC的顺序,通用性逐渐减低,但运算效率逐步提高。

FPGA即现场可编程门阵列,它是在PAL、GAL、CPLD等可编程器件癿基础上迕一步収展的产物。

FPGA芯片基于可编程器件(PAL、GAL)发展而来,是半定制化、可编程的集成电路。发明者:赛灵思联合创始人Ross Freeman于1984年发明FPGA集成电路结构。全球第一款商用FPGA芯片赛灵思XC4000系列FPGA产品。

FPGA芯片按固定模式处理信号,可执行新型任务(计算任务、通信任务等)。FPGA芯片相对专用集成电路(如ASIC芯片)更具灵活性,相对传统可编程器件可添加更大规模电路数量以实现多元功能。

物理结构:FPGA芯片主要由三部分组成,分别为IOE(input output element,输入输出单元)、LAB(logic array block,逻辑阵列块,赛灵思定义为可配置逻辑块CLB)以及Interconnect(内部连接线)。


FPGA芯片在实时性(数据信号处理速度快)、灵活性等方面具备显著优势,在深度学习领域占据不可替代地位,同时具有开发难度高的特点。


FPGA芯片具备以下特点:


  • 设计灵活:属于硬件可重构的芯片结构,内部设置数量丰富的输入输出单元引脚及触发器。

  • 兼容性强:FPGA芯片可与CMOS、TTL等大规模集成电路兼容,协同完成计算任务。

  • 并行计算:FPGA内部结构可按数据包步骤多少搭建相应数量流水线,不同流水线处理不同数据包,实现流水线并行、数据并行功能。

  • 适用性强:是专用电路中开发周期最短、应用风险最低的器件之一(部分客户无需投资研发即可获得适用FPGA芯片)。

  • 地位提升:早期在部分应用场景是ASIC芯片的批量替代品;近期随微软等头部互联网企业数据中心规模扩大,FPGA芯片应用范围扩大。


FPGA厂商主要提供基于两种技术类型的FPGA芯片:Flash技术类SRAM技术类(Static Random-access Memory,静态随机存取存储器)。两类技术均可实现系统层面编程功能,具备较高计算性能,系统门阵列密度均可超过1兆


核心区别:基于Flash的可编程器件具备非易失性特征,即电流关闭后,所存储数据不消失。基于SRAM技术的FPGA芯片不具备非易失性特征,是应用范围最广泛的架构。



CPU为通用型器件,FPGA架构相对CPU架构偏重计算效率,依托FPGA并行计算处理视觉算法可大幅提升计算速率,降低时延。


CPU处理计算指令流程:CPU通过专用译码器接收任务指令,接收过程分为两步:指令获取(CPU从专门存放指令的存储器中提取执行指令)以及指令翻译(根据特定规则将指令翻译为数据并传输至计算单元)。其中计算单元为晶体管(CPU基本元件),“开”、“关”分别对应“1”、“0”机器码数字。

CPU处理计算指令特点:

  • CPU物理结构包括Control(指令获取、指令翻译)、Cache(临时指令存储器)、计算单元ALU(约占CPU空间20%)。

  • CPU为通用型计算任务处理核心,可处理来自多个设备的计算请求,可随时终止当前运算,转向其他运算。

  • 逻辑控制单元及指令翻译结构较为复杂,可从中断点继续计算任务,为实现高度通用性而牺牲计算效率


CPU视觉算法与FPGA视觉算法比较:

CPU架构:CPU用于处理视觉算法需按指定顺序执行指令,第一指令在图像整体运行完成后,第二指令开始运行。在4步操作指令环境下,设定单个操作指令运行需10毫秒,完成总算法耗时约40毫秒。 

FPGA架构:FPGA用于处理视觉算法采取规模化并行运算模式,可于图像不同像素内同时运行4步操作指令。设定单个操作操作指令运行需10毫秒,FPGA完成图像整体视觉算法处理时间仅为10毫秒,FPGA图像处理速度显著快于CPU。

“FPGA+CPU”架构:此架构下,图像在CPU与FPGA之间传输,包含传输时间在内的算法整体处理时间仍低于纯CPU架构。

算法案例:以卷积滤镜图像锐化计算任务为例,系统需通过阈值运行图像生产二进制图像。CPU架构下,系统需在阈值步骤前完成图像整体卷积步骤,FPGA则支持相同算法同时运行,相对CPU架构,卷积计算速度提升约20倍


GPU作为图形处理器件,计算峰值较高,远期在机器学习领域(多指令平行处理单一数据),FPGA相对GPU在灵活性、功耗方面更胜一筹

GPU物理结构:GPU为图形处理器,针对各类计算机图形绘制行为进行运算(如顶点设置、光影操作、像素操作等),标准GPU包括2D引擎、3D引擎、视频处理引擎、显存管理单元等。其中,3D引擎包含T&L单元、 PiexlShader等。

GPU处理计算指令流程:

顶点处理:GPU读取3D图形顶点数据,根据外观数据确定3D图形形状、位置关系,建立3D图形骨架。 

光栅化计算:显示器图像由像素组成,系统需将图形点、线通过算法转换至像素点。矢量图形转换为像素点为光栅化计算过程。

纹理贴图:通过纹理映射对多变形表面进行帖图处理,进而生成真实图形

像素处理:GPU对光栅化完成的像素进行计算、处理,确定像素最终属性,多通过Pixel Shader(像素着色器)完成。

GPU与FPGA特点对比:

峰值性:GPU计算峰值(10Tflops)显著高于FPGA计算峰值(小于1TFlops)。GPU架构依托深度流水线等技术可基于标准单元库实现手工电路定制。相对而言,FPGA设计资源受限,型号选择决定逻辑资源上限(浮点运算资源占用较高),FPGA逻辑单元基于SRAM查找表,布线资源受限。

内存接口:GPU内存接口(双倍数据传输率存储器等)带宽优于FPGA使用的DDR(双倍速率同步动态随机存储器)接口,满足机器学习频繁访问内存需求。

灵活性:FPGA可根据特定应用编程硬件,GPU设计完成后无法改动硬件资源,远期机器学习使用多条指令平行处理单一数据FPGA硬件资源灵活性更能满足需求。 

功耗:GPU 平 均 功 耗 (200W) 远 高 于 FPGA 平 均 功 耗(10W),可有效解决散热问题。


ASIC芯片专用度高,开发流程非重复成本(流片)极高,5G商用普及初期,FPGA可依托灵活性抢占市场,但规模化量产场景下,ASIC芯片更具竞争优势


ASIC与FPGA开发流程区别:


ASIC需从标准单元进行设计,功能需求及性能需求发生变化时,ASIC芯片设计需经历重新投片,设计流程时间成本、经济成本较高。


FPGA包括预制门和触发器,具备可编程互连特性,可实现芯片功能重新配置。相对而言,ASIC芯片较少具备重配置功能。


ASIC与FPGA经济成本、时间成本区别:


ASIC设计过程涉及固定成本,设计过程造成材料浪费较少,相对FPGA重复成本较低,非重复成本较高(平均超百万美元)。


FPGA重复成本高于同类ASIC芯片,规模化量产场景下,ASIC芯片单位IC成本随产量增加持续走低,总成本显著低于FPGA芯片。


FPGA无需等待芯片流片周期,编程后可直接使用,相对ASIC有助于企业节省产品上市时间。 


技术未成熟阶段,FPGA架构支持灵活改变芯片功能,有助于降低器件产品成本及风险,更适用于5G商用初期的市场环境。



中国FPGA芯片行业产业链由上游底层算法设计企业、EDA工具供应商、晶圆代工厂、专用材料及设备供应商,中游各类FPGA芯片制造商、封测厂商及下游包括视觉工业厂商、汽车厂商、通信服务供应商、云端数据中心等在内的应用场景客户企业构成。



FPGA芯片作为可编程器件,流片需求较少,对上游代工厂依赖度较低,需专业设计软件、算法架构支持。

底层算法架构设计企业:FPGA芯片设计对底层算法架构依赖度较低,上游算法供应商对中游FPGA芯片研发制造企业议价能力有限。境外算法架构设计企业包括高通、ARM、谷歌、微软、IBM等。

专用软件供应:FPGA芯片企业需通过EDA等开发辅助软件(quartus、vivado等)完成设计。可提供EDA软件的国际一流企业(如Synopsys)向芯片研发企业收取高昂模块使用费。中国市场可提供EDA产品的企业较少,以芯禾电子、华大九天 、博达微科技等为代表,中国EDA企业研发起步较晚,软件产品稳定性、成熟度有待提高。中国FPGA芯片研发企业采购境外EDA软件产品成本高昂,远期有待境内EDA企业消除与境外同类企业差距,为中游芯片企业提供价格友好型EDA产品。

晶圆代工厂当前中国主流晶圆厂约30家,在规格上分别涵盖8英寸晶圆12英寸晶圆。其中,8英寸晶圆厂相对12英寸晶圆厂数量较多。中国本土12英寸晶圆厂武汉新芯、中芯国际、紫光等为例,平均月产能约65千片。在中国设立晶圆厂的境外厂商包括Intel、海力士等。中国晶圆厂发展速度较快,如武汉新芯12寸晶圆以平均月产能200千片超过海力士平均月产能160千片


中国FPGA芯片行业中游企业拥有较大利润空间,随研发能力积累及应用市场成熟,中游行业格局或发生裂变,从发展硬件、器件研发业务转向发展软件、平台搭建业务


FPGA芯片产品可快速切入应用市场,具备不可替代性,现阶段应用场景较为分散。随技术成熟度提升,终端厂商或考虑采用ASIC芯片置换FPGA芯片以降低成本(ASIC量产成本低于FPGA)。



相对CPU、GPU、ASIC等产品,FPGA芯片利润率较高中低密度百万门级、千万门级FPGA芯片研发企业利润率接近50%可参考iPhone毛利率接近50%的水平)。高密度亿门级FPGA芯片研发企业利润率近70%(可以赛灵思、Intel收购的阿尔特拉为例)。


随FPGA行业中游企业集中度提高,行业格局或发生裂变。中国企业可通过市场策略调整,从硬件研发业务转向软件设计器件研发转向平台建设


本文选自“中国FPGA芯片行业研究报告”,分为上、下篇分析,本文聚焦报告前四章节,内容目录和下载地址如下:

目录:
1、FPGA芯片定义及物理结构
2、FPGA芯片特点及分类
3、FPGA芯片与其他芯片对比
4、FPGA芯片行业产业链
5、FPGA芯片行业市场规模
6、FPGA芯片关键技术
7、全球FPGA大厂竞争
8、中国FPGA芯片行业驱动因素
9、5G通信体系建设提高FPGA芯片需求
10、自动驾驶规模化商用提升量产需求

下载链接:中国FPGA芯片行业报告

相关下载:

ASIC技术专题分析

2021中国智能网卡行业概览

中国数据处理器行业概览(2021)
DPU在数据中心和边缘云上的应用
英伟达DPU集数据中心于芯片

本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。


电子书<服务器基础知识全解(终极版)>更新完毕,知识点深度讲解,提供182页完整版下载。

获取方式:点击“阅读原文”即可查看PPT可编辑版本和PDF阅读版本详情。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。


浏览 42
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报