服务热线:0755 28160800
地址:中国 深圳市 宝安区石岩
街道水田社区第二工业区
业务直线电话:
(86)0755-28160800
(86)0755-29839665
(86)0755-29839692
业务传真:(86)755 2344-2951
前台电话:(86)0755-29839341
前台传真:(86)755-2983-9345
邮箱:ytsales@www.ylwsw.com
【安信电子行业深度】数据中心产业链梳理:CPU平台升级,DRAM周期反转,PCB量价齐升
围绕服务器计算、存储和传输三大功能,我们继续发布系列深度,本篇为系列一计算篇,重点阐述CPU(XPU)升级及其影响。
(1)流量需求长期稳定向上,无线通信和数据通信发展的核心驱动都是流量增长,具体表现为3G/4G/5G网络部署以及后周期数据中心的持续投资;
(2)从行业周期的角度,相比于无线通信技术十年一代的升级周期,服务器平台技术持续升级周期仅为2~3年,说明数据算力提升的需求比网络带宽增加的需求更大;
(3)从市场空间的角度,服务器市场规模超过930亿美元/年,基站设备约为215亿美元/年(服务器基于IDC数据,基站基于三大运营商CAPEX及中国占全球70%左右市场);
(4)供给端:服务器硬件升级的核心是数据处理(XPU)、存储(DRAM和SSD)和传输(光通信-连接器和光模块),国产化能力长期偏弱,供应链集中在欧美日韩台地区,但在贸易战和全球供应链危机背景下,已经呈现加速发展的趋势,我们大家都认为中国大陆电子产业链下一个十年重点看国产替代,服务器产业链值得重视。
■我们推出系列报告详细拆解服务器产业链:系列一至五将分别介绍计算、存储、传输、其他相关固件、以及代工行业投资机会。本篇为系列一计算篇,重点阐述CPU(XPU)升级及其影响:
(1)CPU围绕微结构和制程工艺持续升级,带动芯片设计、制造和封测全产业链景气度回升;
(2)下一代CPU将兼容最新内存标准和PCIe总线标准,“CPU+芯片组+总线”平台升级影响在于:主板PCB高速性能跃进(层数和材料变化);CPU功耗增加,主板散热性能和电源功率同比提升。
(1)华为鲲鹏生态系统及系列服务器市场推广进度(云计算IaaS市场全球第六国内第三);
(2)CPU/GPU/AI加速芯片上游制造和封测产业链,建议关注中芯国际、长电科技和通富微电(封测)和兴森科技(封装基板)、胜宏科技(显卡线路板),推荐深南电路;
(3)主板高速PCB及上游覆铜板CCL材料,重点推荐生益科技和华正新材(CCL)、深南电路和沪电股份(PCB);
(5)服务器主板模块电源,关注中国长城(持有飞腾30%股权)、新雷能和中恒电气。
■风险提示:Intel下一代服务器CPU平台升级没有到达预期;Intel 10nm制程工艺没有到达预期;华为鲲鹏生态建设和推广不及预期
服务器主板上数据传输流依次为CPU、内存、硬盘和网卡,针对图形加速特殊场景增加GPU。具体过程表现为:数据经由网卡封装与解封、链路管理、数据编码与译码后,储存于外存(硬盘为主)之中;当程序需要执行时,将数据从外存经由一级存储器,传至CPU。其中一级存储器分为容量相对较大的主存储器(内存DRAM)和容量较小但速度接近CPU的高速缓存。
CPU发挥“大脑”的功能,负责数据的处理和运算,CPU与GPU、内存、硬盘和网卡间并不能直接通信,一定要通过内存控制芯片、PCIe控制芯片和I/O处理芯片等实现,这类通信协调芯片构成主板上的“芯片组”,芯片组通过各类不同总线(PCIe总线、USB总线和SPI总线等)与CPU相连。如果说CPU是“大脑”、总线就是“神经结构”,芯片组就是“神经中枢”,决定了主板总线频率和带宽,以及扩展插槽和扩展接口的种类和数量。
围绕微架构和制造工艺,CPU本身持续升级换代;同时由于CPU结构和功能设计影响芯片组的集成度和总线类型,“CPU+芯片组+总线”构成“CPU平台升级”;平台升级带动服务器主板和其他配件同步换代。服务器CPU厂商在新一代CPU正式对外发布之前,一般提前2年左右将平台雏形、投放和测试性能以及样片给客户,做同步测试(兼容性和生态)和研发,确保芯片与使用该芯片的服务器同步上市。因而,除CPU和芯片组之外,还要关注平台升级对其他服务器硬件的影响:
主板方面,包括PCIe总线、内存、GPU和SSD。CPU内部集成PCIe控制器和内存控制器,PCIe总线点对点连接CPU与各类高速设备,包括GPU、SSD和网卡等,伴随PCIe升级至5.0,新一代CPU平台产品将兼容PCIe5.0标准,带动各类高速设备同步升级;而内存将从DDR4型号升级至DDR5,相关厂商或将逐步进入量产阶段。
服务器CPU架构包括X86、ARM和MIPS等,x86为当前服务器CPU主流架构,几乎占据目前服务器全部市场占有率,代表性厂商为Intel和AMD。国内方面,海光、兆芯和申威等也参与X86架构CPU的国产化替代,目前主要定位政务市场。短期来看,Intel在服务器市场历史深厚,全球CPU市占率在95%左右。未来2~3年内,Intel仍有望保持行业龙头的地位,因而围绕其CPU平台的升级仍是影响服务器硬件产业链周期性变化的关键因素。
Intel以Xeon为品牌名称持续推出系列新产品,产品型号命名复杂且动态变化:
(2)每一代平台产品具有多个子代,视CPU架构、工艺、PCIe控制器和内存控制器的不同而有差异:例如,自2017年7月规模商用的Purley平台包括SkyLake和CascadeLake两代,均采用14nm工艺最高28核心,但是支持的内存通道数从6通道升级至8通道,PCIe3.0接口数增加。
(3)不同平台的各个子代拥有多种型号名称:2017年Purley平台将产品型号命名方式由此前连续使用四代的E7/E5变为“至强可扩展处理器(Intel Xeon Scalable Processor,SP)”,系列型号按铂金(Platinum)、金(Gold)、银(Silver)、铜(Bronze)定义。
2006年,Intel借意钟摆摆动周期提出“钟摆战略(Tick-Tock)”,Tick年(大年)改制程工艺,Tock年(小年)改架构,按照两年的周期交替推进产品升级,该模式下Intel成功推进了22nm~14nm系列芯片的迭代。
2016年,Intel终止“Tick-Tock”转而采用“制程-架构-优化”(PAO)战略,P(Process)年改工艺,A(Architecture)年改架构,O(Optimization)年优化,按照三年的周期交替推进产品升级。背后问题大多在于芯片制造工艺升级的进度放缓。
新一代产品升级会带动CPU性能提升一倍,价格增长20%~30%。CPU由运算器、控制器和寄存器组成,在服务器中性能最重要,成本也最高,视不同参数而异,均价在1500元/片,占服务器硬件成本的20%以上。一个CPU可以封装多个处理器内核,称为“多核并行”,多核CPU既能大大的提升运算性能,又能延续服务器生命周期。最新一代Intel Xeon Cooperlake 10nm工艺为56核心,使用周期为3年以上。下一代核心数和单核心性能有望同步跃升,带动价格上行。虽然考虑到兼容性问题,新产品上市后老产品仍会存在一段时间,且迎来降价,但新产品爬坡进度较快,甚至有望在一年内达到50%以上,而老产品逐步退场。事实上,从Intel数据中心(DCG)业务收入来看,新产品上市会带动相关业务持续2~3个季度的高增长。
受益于CPU升级换代,服务器需求量有望迎来增长。主要是新平台上市前,下游厂商会部分延缓采购需求,而等到新平台上市后,将前期压抑的需求释放开来。在数据指标上,受产品出货顺序的影响,CPU是服务器上游元器件,因而最先反映服务器市场需求情况,Intel DCG业务增速成为行业景气度先验指标,大概提前4~5个季度。2019年上半年连续两个季度负增长后Q3慢慢的出现回升,连续Q3和Q4两个季度增长,预示下游服务器需求企稳回升。
服务器需求量增长带动CPU出货量提升,且增速高于服务器出货增速。单台服务器按性能需求能够正常的使用多个CPU,一个CPU称为单路,两个CPU称为双路。目前普遍的使用的均为双路服务器,而四路、六路及以上服务器也有特定的应用场景。一般而言,八路及以下服务器为普通机,16路及以上服务器为小型机,大型机则一般以定制化独立封闭系统为主。总体看,目前服务器市场以双路服务器为主,根据ZDC多个方面数据显示,2018年双路服务器受到47%的关注,四路服务器受到29%的关注。随着云计算大数据的普及,四路服务器展现出较广阔的市场空间,具体应用领域有ERP系统、商业智能分析和虚拟化应用等。
量价齐升,Intel数据中心(DCG)业务回暖迹象明显,从以往来看,新产品上市会带动DCG业务持续2~3个季度的高增长,2020年及2021年Intel Whitley和Eagle Stream陆续上市,DCG业务有望迎来新一轮高增长。Intel产品主要覆盖PC、数据中心、物联网、存储器和编程五大板块,2019财年依次实现收入371亿美元、235亿美元、47亿美元、44亿美元和20亿美元,收入占比依次为51.5%、32.6%、6.5%、6.1%和2.8%。
Intel业务覆盖设计、制造和封测全产业链,是典型IDM厂商,尤其在HPC领域主要是依靠自主产能。因而当前背景下由Intel主导的服务器CPU平台升级,受益于此的芯片产业链厂商限于Intel自身。在中国大陆,Intel拥有大连和成都工厂,其中成都工厂是Intel最大和技术最顶尖的封测基地(大连工厂目前聚焦存储业务)。
制造端,服务器HPC(高性能计算)芯片制造工艺已经从2017年广泛使用的14nm工艺向10nm和7nm演进。芯片制造包括IDM(Integrated Device Manufacture)和Foundary代工厂两种模式,IDM厂商如Intel和三星等,Foundary厂商如台积电和格芯等,但是主要参与者在工艺进度上存在差距。从目前主流制造厂进度看,Intel服务器CPU还停留在14nm工艺,核心看点是2020年秋季发布的Ice Lake(Whitley平台)10nm工艺以及2021年初Sapphire Rapids(Eagle Stream平台)7nm工艺。相较之下,竞争对手AMD已经在2019年Q4的Rome系列使用7nm工艺,代工厂为台积电。格芯于2012年从ADM拆分而来,目前在工艺制程上相对落后。
封测端,HPC(高性能计算)芯片封装主要是依靠立体堆叠技术,目前普遍应用的是扇出型晶圆级封装(FOWLP)与2.5D封装,未来将向3D封装演进。3D封装通过高端TSV(硅穿孔)技术,将处理器(CPU/GPU/FPGA/NPU)和存储器(HBM,高频宽存储器)垂直叠合,从而减小传输路径,提升整体运算速度。相较于FOWLP和2.5D封装技术,目前3D封装开发成本高、制程难度上复杂、成品良率较低。根据Yole的数据,2018年HPC占据2.5D/3D封装市场的20%,到2023年有望提升至40%。
封测行业包括IDM和OSTA(Out Sourced Assembly and Testing,委外封测代工)两种模式,参与者包括IDM厂商(如Intel、三星、美光和海力士等)、OSTA厂商(如日月光、安靠、长电、力成、华天和通富等,以及Foundary代工厂如台积电和格芯等)。2008年,IDM和OSTA占比分别为56%和44%,2018年则为46%和54%。因而封测行业呈现由IDM向OSAT逐步转型的趋势。
根据Yole数据,在先进封装晶圆市场占有率方面,2017年英特尔12.4%、矽品11.6%、长电科技7.8%位列第三。而在HPC先进封装领域,IDM厂商和Foundary代工厂走在前列。Intel于2019年初提出Foveros的3D封装,2019下半年陆续有进展。台积电于2019年4月完成首颗3D IC封装,2020年逐步导入,预计将于2021年量产。格芯于2019年8月采用12nm FinFET工艺成功流片基于ARM架构的HPC 3D封装芯片。
X86市场Intel是当前绝对龙头,AMD为最大潜在竞争对手,7nm制程工艺已超越Intel当前10nm水平。根据Mercury Research,2019年Q4 AMD在服务器、PC和移动CPU市场占有率分别达5%、18%和16%,CPU整体市场占有率约为15%。AMD 高管表示,现阶段目标是在服务器、PC和笔记本市场分别占据26%、25%和17%份额。
ADM主营业务划分计算和图形、企业嵌入式和半定制化两大大板块,2019年计算和图形业务收入47.09亿美元,营收占比约70%;企业嵌入式和半定制化业务收入20.22亿美元,营收占比约30%。其中计算和图形板块收入贡献大多数来源于CPU。
Zen CPU架构路线图包括企业级EPYC霄龙、消费级Ryzen锐龙两条线。服务器EPYC方面,根据易特创芯,AMD已发布两代产品,分别是14nm Zen“那不勒斯”(Naples)、7nm Zen 2“罗马”(Rome),即EPYC服务器芯片跳过Zen+架构立即进入Zen 2架构。接下来7nm Zen 3(Milan),5nm Zen 4“热那亚”(Genoa)正在规划中,AMD透露“米兰”有望于2020年Q3推出,预计“热那亚”推出时间最晚在2022年上半年,内存DRAM方面兼容DDR5。
AMD EPYC的发布和使用,使Intel垄断地位遭到挑战。从目前进展来看,Intel 10nm工艺进展缓慢(7nm预计在2022年以后发布,但目前下游还没有拿到测试样片),AMD 7nm工艺处理器有望在2020年商用。目前AMD与下游联想等展开合作,服务器产品在微软、腾讯和阿里开始小批量渗透。根据Mercury,2018年Q2以来Intel市占率从99.5%开始持续被AMD蚕食。
AMD于2008年实施轻资产战略,此后通过一系列业务分拆逐步从IDM芯片商转型为Fabless设计商:(1)2009年将晶圆制造部门独立出来,成立格芯(GlobalFoundary),2012年出售给阿布扎比的阿联酋姆巴达拉技术公司;(2)2015年将中国苏州和马来西亚槟城封测厂出售给通富微电,并通过合资公司(JV)的形式运营,通富微电和AMD分别持股85%和15%的模式,通富微电支付3.71亿美元作为交易对价。
(1)代工方面,台积电于2018年率先实现7nm工艺量产,同时5nm工艺领先同行业半年以上,预计将于2020年下半年实现大规模量产,因而台积电是AMD服务器CPU代工的主力供应商;
(2)封测方面,通富微电收购AMD苏州和槟城工厂后,承接了AMD 80%的封测业务(根据公告),通富超威苏州成为第一个为AMD 7nm全系列新产品提供封测的工厂(根据通富微电2019年年报);
(3)封装基板方面,封装基板占封测成本的40%以上(根据深南电路公告),目前供应链集中在日韩台地区,日本尤其占据高端CPU封装基板市场,2017年全球前十大IC载板厂商合计市占率高达 83.3%(根据 Prismark),行业集中度高。国内从2008年开始相继布局,目前产品集中在微机电系统、存储和射频模块等领域,主要使用在于移动手机,深南电路和兴森科技进展相对较快,2019年上半年IC基板业务分别实现营业收入5.01亿元和1.35亿元。
基于以上分析,处理器代工和封装基板国产替代空间大,长期成长可期,建议着重关注国产替代供应商中芯国际、深南电路和兴森科技等;短期从业绩弹性的角度,AMD产业链建议着重关注上游封测供应商通富微电。
通富微电于2016年联合大基金收购AMD中国苏州和马来西亚槟城高端封测厂,公司和AMD分别持股85%和15%成立了两家合资企业。苏州和槟城工厂作为高端平台,以FCBGA产品为主,主要开展CPU、GPU及游戏机芯片封测业务,目前已开始量产AMD 7nm产品。2018年全球排名由2017年的第七上升至第六。公司目前前两大股东为华达集团和国家集成电路产业投资基金(以下简称“大基金”),股权占比分别为26.66%和21.72%。
截至目前,企业具有崇川、苏通、合肥、苏州、厦门、马来西亚槟城六家工厂:崇川是大本营,产品较为综合;苏通工厂产品主要使用在于手机;合肥工厂重点是超高密度框架封装产品,同时承接周边存储器及LCD驱动器业务;厦门工厂重点做BUMPING和WLCSP,以及LCD驱动器、Gold BUMP产品。
客户方面,公司覆盖50%以上全球前20强半导体企业,主要客户有AMD、MTK、ST、TI、NXP、英飞凌、Broadcom、东芝、富士电机、瑞昱、展讯、汇顶、卓胜微、艾为、韦尔等。其中,AMD为第一大客户,根据2019年年报,公司前五大客户合计收入占比为67.03%,其中AMD占比为49.32%,第二大至第五大客户收入占比依次为6.64%、4.96%、3.84%和2.28%。
2019年公司业绩呈现前低后高的特征,上下半年分别实现营业收入35.87亿元和46.8亿元,分别同比增长3.13%和24.97%。根本原因是上半年半导体行业整体低迷,而下半年受益于大客户AMD 7nm高端处理器上市,公司有关产品顺利实现量产,2019年Q3和Q4分别实现营业收入24.67亿元和22.12亿元,同比增长23.26%和26.92%。
长期来看,一方面,AMD在X86架构下产品进度势如破竹;另一方面,ARM架构有望发挥在移动端市场的份额优势,借力端/云协同,抢占服务器市场更多份额,目前站队ARM架构的代表厂商包括华为海思、飞腾、高通、Cavium和Amazon等。此外,国产化主旋律下,以华为、飞腾、海光和兆芯等为代表的本土CPU厂商有望抢占国内利基市场,包括政务、金融、电力等国产化需求强劲的部门。
2015年4月9日,美国商务部拒绝Intel向国家超级计算广州中心出售芯片用于“天河二号”系统升级的申请,同时国家超算长沙中心、广州中心、天津中心和国防科大被列入出口管制名单,极大地刺激了国产处理器芯片的产业化进程。2019年5月,华为再次遭遇美国商务部芯片禁运,国产化替代更为紧迫。
经我们测算,国产CPU拥有42亿美元以上的本土市场空间,且未来受益于数据需求量提升,空间有望持续扩大。不同线程、工艺和主频的服务器CPU价格不相同,按照1500美元/片的平均单价和3000万片/年的出货量测算,市场规模在450亿美元/年左右。结构上,根据IDC,2019年中国市场服务器出货量约占全球的30%,市场空间约为135亿美元/年,其中来自云巨头、互联网厂商、政府、金融和制造业的需求占比依次为39%、26%、19%、12%和2%,需求规模依次为50亿美元、34亿美元、26亿美元、16亿美元和3亿美元。从需求特征来看,云巨头越来越加速服务器甚至是上层处理器和AI芯片的自研,互联网厂商基于性价比考虑主要拥抱Intel和AMD等国际巨头CPU供应商,而国内政府、金融和电力企业等处于安全考虑国产化需求持续提升,这部分市场空间超过42亿美元。
CPU国产化途径主要有三种:一是获得IP核授权,二是获得指令集架构授权,三是自主研发指令集。其中,IP核授权以一个内核为基础加上自己的外设,技术门槛相比来说较低,功能上能轻松实现差异化,但自主可控程度较低;指令集架构授权则可以对架构进行扩展或缩减,自主可控程度高,但技术难度也比较大,同时面临ECO构建的难题。目前商用的指令集架构最重要的包含x86、ARM、MIPS和ALPHA等:
x86架构掌握在Intel和AMD手中,不对外开放,天津海光和兆芯通过IP核授权的方式自研CPU;
ARM架构为ARM公司所有,对外开放架构授权和IP核授权,国内华为鲲鹏和飞腾均获得64位V8指令集授权;
MIPS架构在2018年获得Wave Computing的正式完全开源,国产厂商 龙芯在2008年一次性买断MIPS指令集永久授权;
ALPHA架构为美国DEC所有,目前已经停止更新,国产申威获得该架构授权,大多数都用在超算和军用市场。
从技术优势、市场应用和ECO构建等角度看,ARM架构目前最具与x86抗衡的实力。
相较于x86,ARM在“多核并行”提高CPU算力方面更具技术优势。CPU算力提升路径有两种,一是提高单个核心的运算效率,通常以CPU主频大小来衡量,主频越高,运算速度越快,这种方法主要以质取胜;二是增加运算核心的数量,在同一个硅片(Die)上集成多个独立的物理核心,通过协同工作实现性能倍增,这种方法以量取胜。虽然CPU主频与算力正相关,但也与功耗正相关,当主频提高到一定水平,会面临功耗的约束。x86更注重单核性能,坚持性能+速度的发展趋势与模式,功耗几十瓦到几百瓦不等;ARM则偏重多核并行,功耗上较x86表现更好。
开发难度低、设计自由度高、自主化程度强是ARM架构相较于x86的另一大优势。ARM架构由ARM公司以IP设计和对外授权的方式运营,合作伙伴获得IP授权许可证,并支付IP许可费用和每块芯片版税。在IP授权形式下,芯片设计商可以直接拿到授权图纸,研发周期快速缩短,同时能结合自身需求开发出定制化的CPU。而x86授权相对封闭,目前下游芯片设计商仅能够最终靠处理器核授权而非架构授权的方式开发产品,设计自由度和自主可控度都比较低。
ARM公司于2016年被日本软银高额溢价收购,并从伦交所退市。ARM公司最初由苹果、诺基亚、Acorn、VLSI、Technology等合资创立,2016年9月7日,日本软银正式以240亿英镑完成对ARM的收购,ARM也正式从伦敦证券交易所退市。从估值看,2015年ARM出售的收益和净利润分别为14亿美元和5亿美元,按收购对价PS和PE分别为17倍和48倍,而同期美股Intel PS和PE估值分别为3倍和17倍,AMD PS估值为2倍(2015年亏损6.6亿美元)。
此外,ARM在移动端市场拥有非常大的优势,受益于端云协同,市场有望不断向服务器和网络基础设施市场延伸。移动终端和IoT市场超过90%的CPU基于ARM架构研发,包括高通、苹果、华为海思和三星等。根据IDC,移动终端占全球终端出货量比重已经由2010年的44.7%上升到2018年的77.6%,预计到2023年将超过80%。此外,移动应用也主要基于ARM指令集开发、测试和运行。
服务器:受益于云游戏、移动办公等的兴起,移动应用将逐步向云上迁移。端云协同下,云端计算架构采用与移动端相同的计算平台,能轻松实现应用开发、部署和运行的无缝协同,大幅度降低开发者难度。目前ARM在服务器市场占有率不到5%,未来有望打破x86垄断地位。事实上,在分布式数据库、大数据、Web前端等高并发应用场景,ARM架构“多核并行”的优势显著,众多芯片设计商和云巨头均已布局基于ARM架构的服务器系列产品。
网络基础设施:目前基于ARM的处理器在网络基础设施市场(基站)约占28%份额(根据IDC)。2020年4月16日ARM加入O-RAN联盟(由全球主要运营商于2018年在MWC期间成立,致力于接口开放化、硬件白盒化和软件开源化),进一步深化5G基础设施市场布局。传统网建使用诺基亚、爱立信和华为等提供的专有硬件(OEM),运营商为应对5G网络建设正努力用白盒平台取代黑盒硬件,西班牙电信和沃达丰已在欧洲和非洲大部分地区部署Open RAN技术。ARM Neoverse芯片架构专门针对此开发,2020年Marvell最新一代Octeon处理器搭载ARM芯片,Ampere推出业内第一款80核ARM架构64位处理器Altra,用于云和边缘计算数据中心(曾推出的 Octeon TX2 被诺基亚和三星宣布用于下一代基站硬件)。
芯片设计商方面,国际上高通和Cavium等曾推出基于ARM架构的服务器CPU;国内方面,飞腾和华为是ARM架构的主要拥护者:
飞腾基于ARMv8指令集,于2016年发布飞腾2000,最高支持64核心,主频1.5GHz~2.0GHz,制程为28nm,功耗100W,在性能上与Intel E5服务器芯片持平。
华为于2019年推出第二代鲲鹏920,同样基于ARMv8指令集,最高支持64核心,主频2.6GHz,采用7nm工艺,功耗较业界基准降低30%。
云巨头方面,Amazon和Microsoft均布局使用基于ARM架构的服务器CPU。此外,Amazon和华为均基于ARM架构自主研发系列处理器芯片,即基于ARMv8架构,自研处理器核、微架构和芯片设计。目前均已实现商用。
Amazon于2015年以3.5亿美元收购以色列芯片公司Annapurna Labs,该企业主要研发服务器微处理器。2019年12月,Amazon推出基于ARM架构的自研Graviton 2处理器,成本较上一代芯片降低45%(根据电子说)。
华为:很早便基于ARM架构打造从芯片到服务器的系列新产品,已获得Armv8架构永久授权。2019年发布ARM服务器芯片Kunpeng 920(鲲鹏920),以及基于该处理器的三款TaiShan(泰山)服务器。鲲鹏920采用7nm工艺,可支持64个内核,主频达2.6GHz,集成8通道DDR4和100G RoCE以太网卡;支持PCIe4.0,可提供640Gbps总带宽。
1.3.2.1.飞腾:基于ARM架构形成完整家族产品,主要定位超算和党政军市场
天津飞腾产品有CPU、ASIC和SoC等,CPU最重要的包含入门级服务器的FT-1500A/16、高端服务器的FT-2000+/64、桌面终端的FT-1500A/4、应用于嵌入式工控的FT-2000A/2等。公司最初由国防科大高性能处理器研究团队建立,于2014年成立于天津滨海。
飞腾CPU演进与我国超算成长史同步:以Sparc架构(开源)为基础设计了FT-1000和FT-1500两款CPU,分别在天河一号和天河二号超算中心获得使用;2012年选择ARM阵营,获得授权后开发出FTC660、FTC661两款CPU核,以及FT-1500A/4、FT-1500A/16、FT-2000、FT-2000plus 5款CPU。“天河三号”E级原型机采用全自主创新的飞腾CPU。目前,飞腾系列CPU已形成完整家族,可满足党政军多个领域的实际需求。
2019年8月26日,中国长城以3.5亿元向华大半导体(实控人为中国电子)和中国振华(实控人为中国电子)分别收购其持有的天津飞腾13.54%和21.46%股权,收购完成后,中国长城持有天津飞腾35%股权,为第一大股东。
²国防科大自1978年承担我国巨型机研发。1984年由其主导研发的第一代巨型机“银河”面世;2007年,国防科大与天津滨海新区签署合作协议,联合开展千万亿次超算研制,共同建设国家超算天津中心,命名为“天河”,2009年天河一号研制成功,计算速度曾位居世界第一;2013年6月17日,天河二号面世,计算速度再次登上全球榜首;2020年,运算速度将达到百亿亿次的天河三号有望研制成功,首次实现所有元器件国产化,同时也是继神威太湖之光之后第二台全面搭载国产自主处理器的超算平台。
2017年和2018年,天津飞腾分别实现营业收入3265万元和6369万元,分别实现净利润82.79万元和170.50万元。同期,中国长城分别实现营业收入96.07亿元和100.09亿元,分别实现净利润6.69亿元和10.56亿元。目前,飞腾营收体量还比较小,且主要定位超算和政务市场,但是定位ARM路线有望受益于行业生态体系的培育实现发展壮大,未来需持续关注民用化进程。
1.3.2.2.华为:“一云两翼双引擎”布局鲲鹏计算产业,2020年加速发展
2019年9月,华为首次发布基于“鲲鹏+昇腾”双引擎计算战略,打造“一云(华为云)、两翼(智能计算业务、智能数据与存储业务)、双引擎(鲲鹏芯片、 昇腾芯片)”计算产业布局,包括PC、服务器、存储、操作系统、中间件、虚拟化、数据库、云服务和行业应用等。
云服务方面,华为云成立于2011年;2017年3月成立Cloud BU开展公有云业务;2019年,华为Cloud&AI(整合了计算、存储和云服务)正式从BU上升为BG,与运营商、消费者和企业三大BG并列。华为云虽然相较于竞争对手进入市场较晚,但凭借全栈(硬件+软件/前端+后端)技术能力发展迅猛:
在中国市场,入选Gartner中国云计算IaaS第一梯队。2019年Q1~Q3在IaaS+PaaS市场连续3个季度增长超过300%,IaaS+PaaS和IaaS市场占有率均超7%(根据2019年年报),排名均上升至第四;2019年Q4在IaaS和PaaS市场均位列第三(根据Frost&Sullivan)。在IaaS市场,阿里云、腾讯云、华为云、天翼云和金山云位列前五,市占率合计达78.1%;在PaaS市场,阿里云、腾讯云、华为云、天翼云和AWS位列前五,市占率合计达81.6%。
在全球市场,华为云全球IaaS市场排名上升至第六,增速高达222.2%,全球增速最快(根据Gartner)。2019年华为云新加坡、智利、巴西、墨西哥、秘鲁大区陆续开服,与伙伴在全球23个地理区域运营45个可用区。
具体业务方面,下业应用的培育是业务开展的关键,而行业应用拓展存在的难度最重要的包含:(1)行业广、应用多、堆栈深、区域属性强,软件组件依赖关系复杂(只要一个环节不支持整个应用不可用);(2)用基于传统计算架构的行业标准来评估新计算架构,制约行业应用往新计算架构迁移。比如HPC行业应用普遍采用衡量双精度浮点计算能力的HPL(High-Performance Linpack)标准来评估系统性能,但这并不符合内存密集型等应用的业务实际的需求;(3)应用软件迁移到新计算平台带来的额外成本与带来的市场收入不成比例。
鲲鹏计算产业布局主要三个阶段(根据华为《鲲鹏计算产业高质量发展白皮书》):第一阶段为试点阶段,树立标杆行业典型场景,具体包括政务、电信、金融和互联网;第二阶段为推广阶段,将行业范围扩展至18+;第三阶段为深化阶段,达到全行业全场景。截至目前,鲲鹏计算产业在政府、金融、电信和互联网等主要场景已经规模商用,可满足20%业务场景迁移至鲲鹏计算平台。
在芯片布局方面,华为拥有ARMv8永久架构授权,并完全掌握64处理器核芯片设计技术,在此基础上发布了基于ARM架构的鲲鹏系列处理器,同时开发了包括“算、存、传、管、智”在内的全面芯片体系。
2019年1月华为发布的服务器处理器 Kunpeng 920(鲲鹏920)性能表现优异:鲲鹏920包括32/48/64核版本,采用7nm制程工艺,主频可达2.6GHz,集成8通道DDR4和100G RoCE以太网卡,还支持PCIe4.0接口,可提供640Gbps总带宽。典型主频下,SPECint Benchmark 评分超过930,超出业界25%;能效比优于业界标杆30%。相比竞品内存宽带提升46%,总I/O带宽提升66%,网络带宽提升4倍;
除了处理器芯片(XPU),华为大力拓展硬件OEM和软件(操作系统、数据库和虚拟化等)合作商,从关键器件(电源芯片/CPLD)、核心部件(SSD卡、网卡、RAID卡、显卡和内存等)、基础软件到上层行业应用:
服务器整机都会存在厂商利润率低、硬件设计(包含BIOS、BMC芯片)能力参差不齐、以及配套部件(内存、硬盘、网卡、显卡等)可获得性、兼容性差等问题。泰山服务器旨在树立标杆,使能整个鲲鹏计算产业链,带动相关厂家发展基于鲲鹏处理器主板的自有品牌服务器。当条件成熟华为可逐步停止泰山服务器销售,转为服务器主板和部件供应商,最终在服务器整机领域形成多厂家的格局。2020年3月27日华为开发者大会上,华为Cloud&AI BG总裁侯金龙表示,华为已在北京、广州等地成立15个鲲鹏创新中心,11家品牌商推出基于鲲鹏主板的服务器和PC产品。
(2)联合整机、BIOS、厂商和OS厂家共建开放的IO总线和管理接口标准:
OS厂商适配多种CPU架构导致版本多,OS与应用适配工作量大;基础软件厂商(数据库、中间件、大数据、云平台)对鲲鹏计算平台的适配仍处于起步阶段 ,缺少核心系统应用。建立IO总线和管理接口标准并对外开放,一方面相关公司能够开发各种部件,另一方面使能IBV(独立BIOS供应商)发展BIOS生态,使整机厂商具备总线定制能力,进而实现品牌差异化。截至目前,鲲鹏计算产业已经有相对完整的基础软件生态,获得了Linux操作系统、虚拟化软件、数据库、中间件等的全面支持。
(3)基于自身的硬件兼容性实验室,对操作系统、内存、硬盘、网卡等进行统一的兼容性认证测试,并定期发布兼容性清单,来保证OS、部件与整机的兼容性。
从业务成长性看,华为主要经营运营商、消费者、企业三大业务,2019年三大业务分别实现收入2967亿元、4673亿元和897亿元,收入占比依次为34.55%、54.41%和10.45%,收入增速分别为3.8%、34%和8.6%。除以上三大业务外,2019年别的业务收入为51.3亿元,同比增长30.6%,收入占比0.6%(华为尚未对Cloud&AI业务单独披露)。当前,运营商业务发展已步入成熟期,华为在全球通信主设备市场位列第一;消费者业务加速成长,华为手机销量仅次于三星位列全球第二;企业业务增长稳定;Cloud&AI业务基数小,发展的潜在能力巨大。
服务器端:2019年华为实现硬件收入36.47亿美元(根据IDC),同比下降6.5%,市场占有率为4.2%,全球排名位列第七。
云服务端:2019年华为云增长超过3倍(根据徐直军)。2019年全球云计算IaaS市场规模达445亿美元,同比增长37.3%,前四大龙头亚马逊AWS、微软、阿里和谷歌份额分别为45%、17.9%、9.1%和5.3%,华为位列第六(根据Gartner)。因此对标云计算巨头,华为依靠鲲鹏生态系统建设,发展空间巨大。
受益于华为鲲鹏计算产业链的培育,行业上下游有望分享红利。根据《鲲鹏计算产业高质量发展白皮书》,到2023年全球计算产业投资空间1.14万亿美元,中国占比约10%达1043亿美元,其中服务器及部件市场空间预计2378亿元,假设鲲鹏架构市场占有率50%,则2023年鲲鹏服务器硬件市场空间1189亿元。
华为鲲鹏系列服务器的发展思路是,现阶段通过泰山服务器树立标杆使能整个产业链,带动相关厂家发展基于鲲鹏处理器主板的自有品牌服务器,形成多厂家格局;当条件成熟,华为或将逐步停止泰山服务器销售,产能由核心合作伙伴承接。
服务器整机市场有品牌厂商和ODM厂商两类:(1)品牌商完全自主研发、设计、采购、组装和销售,具备硬件架构设计能力及配套软件开发能力,通过招标和渠道的方式分别向下游客户销售;目前主要的品牌厂商包括HPE/H3C、戴尔、浪潮、IBM、华为和联想等。(2)ODM厂商则为品牌厂商提供部分机型的代工生产,主要负责后端制造,在产品研制环节配合主要客户完成,同时在销售环节面向大客户以阶段性招标和锁价的形式实现,往往是台系厂商,包括:纬创、纬颖、富士康、广达和英业达等。
目前,全球服务器自主品牌参与者最重要的包含戴尔、HPE、浪潮、华为、新华三、联想、IBM、曙光和宝德等。2019年全球服务器市场前三依次是戴尔、HPE、浪潮(按销售额,根据IDC),市场占有率分别为17.8%、14.8%和7%;中国服务器市场前三名依次是浪潮、华为和新华三,市场占有率分别为28.7%、16.4%和13.1%,排在后面的依次是戴尔、联想、曙光和宝德,合计占比32.1%,ODM厂商占比2.9%。
截至2020年3月底,已有11家品牌商推出基于鲲鹏主板的服务器(根据华为Cloud&AI BG总裁侯金龙),当前主要定位组装,未来可慢慢地提高设计能力,在泰山服务器退出销售后承接其产能:2019年9月,山西百信发布基于华为鲲鹏的“恒山”服务器;2019年12月,河南黄河科技集团成立“黄河”品牌,黄河鲲鹏服务器生产线正式投产并实现首批产品交付,规划2020年形成35万台的生产能力;2019年12月,湖南拓维信息成立湘江鲲鹏,并获得华为鲲鹏主板自主品牌服务器研发制造授权,公司预计在2020年4月完成产线月完成产品下线月份如期投产,今年的生产目标是6万台服务器和PC(根据公告);2020年1月,浙江东华软件宣布首批基于鲲鹏处理器的服务器“鹏霄”已完成软硬件兼容适配,宁波鲲鹏生态产业园开园,鹏霄服务器首发首用;2020年3月,神州数码首个鲲鹏系列新产品生产基地在厦门正式动工,一期整体规划面积三万平方米,生产基地为一万平方米。一期产线投产后,服务器年产能预计达10万台(根据公告);2020年3月,宝德发布基于鲲鹏处理器的服务器新品PR212K。
受益于鲲鹏产业链的建立和完善,硬件端中长期看好鲲鹏系列处理器上游供应商,包括IC代工和封测。依照我们的假设和测算,2020年鲲鹏产业链服务器端代工和封测市场空间分别有望达到53亿元和18亿元。
鲲鹏系列芯片代工主要由台积电承接,台积电是少数具备成熟7nm制造工艺的厂商之一;封测端,日月光矽品是全球第一大封测供应商,已进入华为鲲鹏供应链,将在今年三季度开始供货(根据与非网),国内厂商长电科技和通富微电技术储备成熟。目前通富微电主要为AMD供应商,承担80%左右的订单(根据2019年年报公告);长电科技与华为存在合作(根据2018年年报公告)。从合作深度和业绩弹性的角度,鲲鹏产业链建议着重关注长电科技。
长电科技于2015年联合产业基金、芯电半导体以7.8亿美元收购新加坡封测龙头星科金朋(SCL)全部股份,2013年营收和毛利润分别为15.99亿美元和2.18亿美元。SCL产品主要应用领域为移动通讯,智能手机市场景气度业绩的关键影响因素。2018年SCL实现营业收入11.69亿美元,净亏损2.71亿美元。根本原因是2018年下半年智能手机进入新旧动能转化期,个别工厂大客户订单下滑,产能利用率不足以及计提资产减值准备。
公司市占率和产品实力位居全球前列:2018年以13%的份额位列全球第三大封测厂商,仅次于日月光矽品29.3%和安靠15.4%(根据芯思想);先进封装晶圆方面,2017年以7.8%的份额位列全球第三大厂商封测厂,仅次于英特尔12.4%和矽品11.6%。产品实力方面,公司在新加坡(星科金朋)、韩国、中国江阴(本部和星科金朋)、滁州和宿迁设有生产基地,本部、星科金朋江阴厂和长电先进均建立起从芯片凸块到FC倒装的能力。目前客户覆盖85%的全球前二十大半导体公司。
2019年上半年中国GPU服务器市场规模为8.3亿美金(根据IDC),同比增长53.7%,同期中国市场x86服务器市场规模为73.9亿美元,短期来看,即GPU服务器占x86服务器市场的11.23%,该比例从2017年的2.01%逐年提升。IDC预测,到2023年中国GPU服务器市场规模将达到44.5亿美金,5年CAGR为27.8%。而中国x86服务器市场约占全球的三分之一左右,假设按照此比例推算,2018年全球GPU服务器市场约为43.5亿美元,到2023年约达到148.3亿美元。
GPU(Graphics Processing Unit,图形处理器)最初是用在PC和移动端上运行绘图运算工作的微处理器,与CPU集成以集成显卡(核显)的形态发挥功能。NVIDIA于2007年率先推出独立GPU(独显),使其作为“协处理器”在PC和服务器端负责加速计算,承接CPU计算密集部分的工作负载,同时由CPU继续运行其余程序代码。作为独显的GPU由GPU核心芯片、显存和接口电路构成,因而受益于新产品升级,GPU产业链除关注芯片代工和封测外,还应重视显卡PCB需求的同步提升。
独立GPU与CPU之间通过PCIe总线连接,因而PCIe总线标准直接影响到通信带宽;而针对GPU之间的互连,Nvidia推出NVLink技术替代传统PCIe总线的方式,带动GPU性能5倍提升(根据Nvidia官网)。
目前由于AI性能挖掘仍有空间,已经部署的服务器中GPU算力尚有冗余,预计PCIe由3.0升级至4.0和5.0短期内对GPU影响不大。但主流参与者仍在工艺路径持续推进产品升级。Nvidia占据独显市场近80%的份额(根据AIB Research),目前其主流产品还停留在12nm工艺,7nm正在规划中。根据Nvidia CEO黄仁勋表示,下一代7nm产品有望迅速推向市场,以配合制造商安排量产规划。
而在独立GPU(独显)市场,Nvida是行业的奠基者和龙头,占据近70%份额。AIB 多个方面数据显示,2019年Q4,Nvidia和AMD在独立GPU市场占有率分别为81%和19%。从新产品进展来看,AMD新系列采用7nm更先进工艺,Intel也表示将在2020年推出独立GPU,采用10nm工艺,大多数都用在游戏端,用于数据中心的高性能7nm工艺GPU有望在2021年发布。
Nvidia有游戏、专业虚拟化、数据中心和汽车四大业务,2019财年四大业务营收分别为55亿美元、30亿美元、12亿美元和7亿美元,合计应收109亿美元,收入占比依次为51%、27%、11%和6%。其中,数据中心(DC)业务自2016年以来持续高成长,2016~2018年收入增速分别为155%、133%和52%,2017年超过专业虚拟化成为公司第二大收入来源。针对HPC和AI场景,Nvidia推出的产品主要是Tesla系列,包括V100、P100、K40/K80、M40/M60等多个型号,K系列更适合高精度计算,M系列更适合深度学习。
2018Q4~2019Q3,Nvidia营收长期处在下降通道,连续四个季度营收增速为负(-24.25%、-30.78%、17.42%、-5.25%),根本原因是游戏负增长,同时DC业务受服务器出货量下滑的影响增速大幅放缓。然而2019Q4拐点已现,营收增速回暖,单季度同比增长高达40.82%。2019年3月,Nvidia宣布以49亿美元收购Mellanox,预计2020年4月底该项交易最终完成,成为Nvidia历史上最大的一笔收购。Mellanox是服务器和存储端到端连接解决方案的供应商,产品涉及HPC、云计算、数据中心、企业计算及存储市场,包括Smart NIC,网络交换机芯片和高速数据互联等;中国市场的主要客户包括阿里巴巴和百度等。该收购完成后,Nvidia在数据中心的业务布局更加完整,同时与Mellanox具备比较好的客户协同优势。
我们看好Nvidia作为独显龙头对于GPU产业链的整体拉动。从产业链来看,独显以扩展设备的形态存在,构件包括GPU核心、显存和接口电路,因此上游供应链除芯片代工和封测外,还有用于芯片集成的PCB。GPU核心端,Nvidia主流产品还停留在12nm工艺,7nm正在规划中,代工和封测以台积电和三星为主。显卡PCB方面,国内胜宏科技高密度多层VGA(显卡)市场占有率位列全球第一(依据公司公告)。从长期市场空间增长和国产化替代进程两个视角,我们看好大陆PCB厂商的成长性,建议着重关注胜宏科技。
胜宏科技PCB以多层板为主,2020年Q1收入结构为,通信类35%-40%、显卡15%、汽车10%、消费30%、LED 1%-2%(依据公司公告)。企业成立之初(2006年)就开始生产高精度多层显卡产品,目前显卡板(PC和主机)全球份额第一,直接客户包括基恩、影驰、蓝宝石、讯景等(依据公司公告)。截至2020年Q1,公司网通类服务器营收占比1%-1.5%,主要是通过ODM厂商(富士康、华硕、技嘉等)布局到戴尔、惠普、阿里、腾讯、亚马逊等下游客户。公司推进与终端品牌的合作,计划向更高端产品切入,公司规划2020年服务器和数据中心业务收入15亿元,占整体规划收入比重超15%(依据公司公告)。此外,公司也在做内存条卡板,目前正处于客户导入和接触阶段。
长期来看,AI芯片在智能摄像头、无人驾驶等领域应用广泛。数据、算力和算法是AI三大要素,“CPU+加速芯片”成为典型的AI部署方案,CPU提供算力,加速芯片提升算力并助推算法的产生。常见的AI加速芯片包括GPU、FPGA(Field Programmable Gate Array)和ASIC(Application Specific Integrated Circuit)三种类型。
CPU适合逻辑控制和串行计算等通用计算,计算能力没有GPU强,主要由专为顺序串行处理而优化的几个核心组成;
GPU用于大量重复计算,由数以千计的更小、更高效的核心组成大规模并行计算架构,配备GPU的服务器可取代数百台通用CPU服务器来处理HPC和AI业务(根据Nvida)。
FPGA是一种半定制芯片,灵活性强集成度高,但运算量小,量产成本 高,适用于算法更新频繁或市场规模小的专用领域;
ASIC专用性强,市场需求量大的专用领域,但开发周期较长且难度极高。谷歌自主设计了一款基于ASIC的TPU(Tensor Processing Unit)专门用于机器学习工作负载。
训练和推断是云端AI两大运行过程,训练产生算法,推断实现算法应用。训练阶段需要大量数据运算,GPU预计占64%左右市场占有率(根据赛迪顾问),FPGA和ASIC分别为22%和14%。推理阶段无需大量数据运算,GPU将占据42%左右市场,FPGA和ASIC分别为34%和24%。AI芯片运营场景包括云端(服务器)、边缘端和终端三类,不同应用场景对AI芯片的需求不同。就云端芯片而言,2023年市场需求将达200亿美元(根据Nvidia)。根据赛迪顾问,到2021年我国市场规模约为221亿元,较2019年增长35%,其中GPU、FPGA和ASIC市场规模分别为114亿元、59亿元和48亿元,GPU为主,FPGA和ASIC平分秋色。
景嘉微是国产GPU先行者,此外,还有长沙韶光(A股航景科技全资子公司)、中船重工709所和716所。
景嘉微持续聚焦GPU国产化,立足军工市场,并逐步向民用拓展。公司于2006年成立,2016年上市,2018年国家大基金通过定增入股9.14%成为公司第二大股东。公司自2010年开始研发具有自主知识产权的图形处理芯片,主要定位国内新研军用飞机市场,并占据绝大部分份额;2015 年第一代GPU JM5400(65nm)通过认证并量产;2018年第二代GPU JM7200(28nm)研发上市,大多数都用在高性能的嵌入式系统,也可以PC和笔记本等民用市场,2018年11月与CPU厂商飞腾及操作系统厂商银河麒麟完全技术适配(根据公告);目前正布局第三代GPU JM9 系列,可用于AI和物联网领域。
从整体实力来看,景嘉微是GPU国产化先锋,与国际龙头产品实力仍有很大的差距,但正在不断缩小。依照产品性能对标,2014年底发布的JM5400与AMD同类型产品相距约12年;2018年9月发布的JM7200与Nvidia同类型产品相距约7年;预计将于2020年发布的JM9231与Nvidia同类型产品相距约4年。
航景科技于2017年以现金全资收购长沙韶光和威科电子,从而形成高端核心芯片和通信两大产业板块。高端核心芯片包括GPU、FPGA、总线的基带射频一体化芯片;通信板块主要指的是适用于5G/6G/星空互联网的多芯片集成电路和模块。电子芯片板块2017~2019年分别实现净利润4400万元、1.17亿元和1.81亿元。2020年公司Q1电子板块净利润增幅50%~80%,公司成功实现转型。
长 沙韶光主打GPU、FPGA和总线接口芯片,GPU既可用于军工装备,也可应用于计算机系统和办公设备,并且已满足自主可控办公系统及服务器需求。FPGA主要使用在于航天航空领域,暂未进入民用市场。总线接口芯片主要使用在于陆军装备。2018年长沙韶光实现营业收入2.7亿元,同比增长303%,实现净利润9177万元,同比增长271%。预计2019年和2020年Q1继续高增长。
威科电子主要承担5G/6G/星空互联网产业的生产任务。威科射频可生产毫米波及太赫兹频段的高频材料,对标美国罗杰斯,目前相关这类的产品已成功研发,并经过下游客户测试,能轻松实现进口替代。泓林微主要负责射频器件的研发、仿真。大多数都用在射频信号的发射跟接收。同时公司还参股了武汉导航院,主要研发基于北斗3的基带射频一体化芯片。
2.4.2.国产FPGA实力强劲,着重关注紫光国微、上海复微(拟科创上市)
AI服务器解决方案,虽然国产化GPU乏力,但以云巨头为代表的芯片设计商在FPGA和ASIC领域表现强劲。同时传统芯片设计商(除云巨头外)在FPGA和ASIC领域均涌现出一批佼佼者。根据赛迪顾问,到2021年我国云端AI芯片市场规模约为221亿元,其中GPU、FPGA和ASIC分别为114亿元、59亿元和48亿元。假设云巨头自研占比为40%(基于云巨头服务器需求占比),则FPGA和ASIC的剩余市场需求分别为35亿元和29亿元。
华为:2019年发布了基于ASIC的AI处理器昇腾系列310(MEC场景)和910(云端),910单芯片计算密度高达256 TOPS(衡量处理器运算能力的指标,每秒钟可进行一万亿次操作),比Nvidia V100标称算力高出约一倍,达到规格算力所需功耗仅310W。32MB SRAM/unit,集成PCIe 4.0接口,采用台积电7nm+EUV工艺。
阿里:2019年推出基于ASIC的处理器含光800,峰值性能达到了78563 IPS(同样是衡量处理器运算能力的指标)。
百度:2020年开发了基于可编写ASIC的昆仑芯片,峰值性能达260 TOPS,功耗150W,目前已经在百度内部规模应用,同时加速与国产CPU飞腾的适配(飞腾CPU是国产芯的代表,采用ARM V8指令集,可应用于数据中心和云计算场景)。2个计算单元,512GB/S内存带宽,16MB SRAM/unit,集成PCIe 4.0接口,采用三星14nm制造工艺和2.5D封装。
传统芯片设计商(除云巨头外)方面,FPGA主要有紫光同创(紫光国微联营企业,持股票比例36.5%)、上海复旦微电子、安路科技、成都华微电子和长沙韶光等;ASIC主要有景嘉微等。目前,上市公司中紫光国微整体产品进展迅速,目前大多数都用在5G通信领域;上海复旦微电子拟科创板上市,产品大多数都用在航空航天领域。此外,AI芯片专业设计商还包括寒武纪、深鉴科技和地平线月寒武纪拟登陆科创板,2018年5月赛灵思宣布收购深鉴科技(2020年4月收购完成)。
3.1.“CPU+芯片组+总线”平台:CPU厂商主导升级,按照2~4年周期推进
南桥芯片(South Bridge,SB)/PCH: 处理输入输出(Input/Output,I/O)数据,负责PCIe总线、USB、ATA、SATA、音频控制器、键盘控制器、高级电源管理和实时时钟控制器等间的通信。位于主板上离CPU较远的下方,原因是连接的I/O总线较多,远离CPU有利于布线。南桥芯片最初发展方向是集成主板上更多的通信功能,如网卡和RAID等,但AMD锐龙低端芯片组许多产品取消了南桥,只支持CPU所支持的拓展,AMD最新Zen2架构平台上,南桥仅使用PCI-E X4通道和CPU连接,将通道拆分后支持几个PCIe接口、USB2.0和SATA接口。未来CPU有望集成更多功能,降低对南桥的依赖。此外,由于技术相对来说比较稳定,不同芯片组中的南桥芯片可以是相同的。
北桥芯片(North Bridge,NB): 负责CPU与内存、加速图形显卡(Accelerated Graphics Port,AGP)以及PCIe总线的通信协调,位于主板上离CPU最近的位置,从而缩短传输距离提高通信性能。北桥芯片最初仅作为内存控制器出现在主板上,此后又扩展了各种控制器,如加速图形显卡。但由于延迟大和故障率高等问题,逐渐被取消。In tel于2012年推出单芯片架构,只保留南桥芯片(改名为PCH,Platform Controller Hub),将北桥芯片集成到CPU中,以PCIe控制器和内存控制器的形式分散存在于晶圆的不同位置。
随着CPU集成度不断强大,主板芯片组的功能有被弱化的趋势,CPU 厂商对芯片组的话语权也在持续提高。服务器芯片组生产商曾经生产包括Intel、AMD、Nvidia和VIA(台湾威盛)等,目前Intel和AMD占据主要市场占有率,尤以Intel为甚,部分国产CPU参与者由于设计能力欠缺采用Intel或AMD的芯片组。
总线是主板传输数据的“道路”,负责CPU与芯片组(PCH)、PCH与功能芯片的连接,包括QPI、PCIe、DMI、SATA、SAS、SPI总线等。其中,CPU与CPU、CPU与PCIe设备分别通过QPI总线和PCIe总线连接,PCH与USB、SATA硬盘、SAS硬盘和网卡等分别通过USB总线、SATA总线、SAS总线、PCIe总线等连接,BMC(Baseboard Management Controller,基板管理控制器)与别的设备通过SPI总线连接。
PCIe总线,负责连接扩展I/O设备,具有高速低时延的性能,满足服务器高速运算、快捷访问数据、访问外设和访问网络的需求。由于是对前两代(ISA和PCI/PCI-X)的升级,PCIe总线又被称为第三代I/O总线GIO),相比于前两代,数据传输速率更高、传输距离更远、功耗更低、抗干扰能力更强,可以连接各类高速扩展设备,典型如加速图形显示处理器GPU(Graphics Processing Unit),除此以外还有AI加速卡、PCIe网卡和视频监控卡等。
传输速率和带宽大小是PCIe总线的核心性能,围绕这两大性能,PCIe总线有特定的升级标准,该标准自2001年确定1.0至今,经历了2.0、3.0和4.0时代,在4.0确立之前,大概按照每三年一代的周期实现性能指标升级。PCIe标准由特殊兴趣组织PCI-SIG组织负责发布,该组织最初由Intel牵头设立,目前拥有近800名会员。2017年,PCI-SIG发布PCIe 4.0标准,2019年5月发布PCIe 5.0。预计PCIe 6.0也将于2021年发布。
标准从落地到商用仍有一定周期。虽然PCIe4.0标准早在2017年发布,但是根据Intel产品路线以后发布的Whitley平台第二代Ice Lake中出现,而适配PCIe5.0的CPU规划在2021年发布的Eagle Stream平台出现。因此预计PCIe6.0商用还有至少三年以上。
PCIe高速设备包括GPU、AI加速卡、视频监控卡、PCIe接口SSD和PCIe网卡等,伴随PCIe升级至5.0,通过PCIe总线连接CPU的以上高速设备有望同步升级。
PCIe总线属于串行点对点双通道传输,在x86系统中体系架构主要由root complex、switch和endpoint三类PCIe设备构成。BDF(Bus、Device、Function)构成每个PCIe设备节点的身份证号,一般PCIe协议支持256个Bus(总线个Device,每个Device支持8个Function。PCIe总线标准升级带宽翻倍的同时,外接的PCIe设备带宽能轻松实现更大提升。根据PCI-SIG官方显示,使用PCIe总线与CPU通信的服务器I/O扩展设