在本年的光纤通信会议(OFC) 会议上,光电共封(CPO)成为芯片厂商的一大热议话题,博通、Marvell介绍了各家的接纳光电共封拆手艺的51.2Tbps的交换机芯片,思科也展现了其CPO手艺的实现可行性原理,在光电共封手艺的撑持下,一个交换机的新时代正在降临!那关于光电共封手艺来说是一个很大的前进,也足以表白操纵光来挪动数据的前景确实是光亮的。

那个赛道也成为了芯片巨头的新战场。

光电共封迎来大的鞭策力

那一波的光电共封器件很大的鞭策者是数据中心的公有云供给商,跟着AI/ML(人工智能/机器进修)、高分辩率视频流和虚拟现实等更高带宽应用的呈现,收集流量持续增长,数据中心收集接受的压力也在不竭增加,诸如谷歌、Meta、亚马逊、微软或阿里巴巴等,他们每家都摆设了数万台交换机,并且正在鞭策数据速度从100GbE向400GbE和800GbE更高速的数据链路的标的目的开展,那将消耗更多的电力来通过铜缆传输数据。

做为交换机的大脑——交换机芯片,在过去多年来次要有两大持久开展趋向:

一,大约每两年一次,交换机芯片的带宽会翻一番,那也很好的遵照了摩尔定律。二,为了撑持总交换机芯片带宽的增加,Serdes的速度、数量和功率也在随之增加,SerDes的速度从10 Gbit/sec增加到112 Gbit/sec,芯片四周的SerDes数量从64通道增加到51.2 Tbps一代的512通道。SerDes功率成为系统总功率的很大一部门。

当下交换机之间所接纳的计划大都是可插拔的光学器件,固然能够很容易地改换或换成更高容量的,但那也意味着在交换机芯片和光学器件接口之间有几英寸的铜,并且因为所需的电气和光学密度、热问题和功耗,当前可插拔光学器件也面对着容量难扩展的造约。于是,业界起头摸索进步数据中心效率的新办法,光电共封(CPO)成为一个有利的选择!

光电共封拆(Co-Packaged Optics,简称CPO)是一种新型的光电子集成手艺,它将光学器件(如激光器、调造器、光领受器等)封拆在芯片级别上,间接与芯片内的电路相集成,借助光互连以进步通信系统的性能和功率效率。配合封拆光学器件的一项关键立异是将光学器件挪动到离 Switch ASIC 裸片足够近的位置,以便移除那个额外的DSP(见下图)。借助CPO,收集交换机系统中的光接口从交换机外壳前端的可插拔模块改变为与交换机芯片组拆在统一封拆中的光模块。

芯片巨头的“新”战场  第1张

基于那种封拆形式,光电共封(CPO)手艺的优势尽显:

加强性能:CPO能够将光学元件间接嵌入芯片中,使得光学元件与芯片内部电路的间隔更近,减小了电信号的延迟和失实,进步了通信系统的性能。节省空间:CPO能够大大减小光模块的尺寸,尤其是在高密度数据中心情况下,能够将更多的端口拆在不异大小的机柜中。降低功耗:CPO能够削减能量转换的步调,从而降低了功耗。与传统的光模块比拟,CPO在不异数据传输速度下能够削减约50%的功耗。进步可靠性:CPO能够进步光学和电子之间的互联可靠性,并削减外部干扰。同时,因为CPO是在芯片级别上封拆的,所以也可以进步整个系统的可靠性。降低成本:CPO能够削减芯片与光模块之间的毗连器数量,从而降低了消费成本。此外,CPO的小尺寸和低功耗也可以降低运营成本。

正因为此,使得越来越多的芯片厂商、光通信厂商和研究机构都在积极研究和利用光电共封手艺。

CPO的贸易化雏形,在交换机市场中闪现

博通

博通(BroaDCom)涉足光电范畴大约在1990年,1995年,Broadcom推出了其第一款光电收发器,那是该公司进入光电范畴的初步。尔后博通停止了一系列收买,1998年收买了光通信设备造造商Epigram;2000年,Broadcom收买了另一家光通信设备造造商Luminent;2016年,Broadcom收买了处置光电器件和模块研发的BroadLight。

能够说,通过不竭收买,高通进一步加强了其在光电范畴的研发才能,博通也开发出了电子、光学和立异封拆架构 (SCIP™) 。养兵千日,现在,博通正将其在光电范畴的手艺积累应用到交换机产物中。

博通在2023年光纤通信会议(OFC) 上谈到了其最新的交换机产物——Broadcom Tomahawk StrataXGS 5,它在单个单片芯片中供给 51.2 Tbps 的以太网交换容量。如下图所示,该交换机值得一提的处所是,Tomahawk 5接纳了光电共封拆的手艺,它将交换机芯片和100G PAM4接口配合封拆在一路,那种新芯片可以削减将信号驱动到交换机前端的可插拔光学器件的需求,大大降低了功耗。比拟于Tomahawk 4 Humboldt 25.6T 6.4W的功率,该交换机仅需要5.5W的功率为800Gbps的流量供电。博通称,因为接纳了光电共封(CPO)的光学手艺,该芯片能将光学毗连所需的功率降低50%以上。

芯片巨头的“新”战场  第2张

51.2Tbps交换机中有一个新的交换芯片,那是一款5nm工艺的单片芯片,它搭载了六个Arm处置器核心,交换机上还撑持VxLAN单通道以及PTP和SyncE等特征,可供给多达64个800GbE、128个400GbE、256个200GbE或512个100GbE链路。现实上,那些交换芯片是为了100GbE以上速度的交换机而设想的。博通暗示,一台新的Tomahawk 5交换机能够有效地代替48台2014年代的Tomahawk 1交换机。

除了交换机芯片之外,博通还有光电共封的收发器产物。它也接纳了博通的硅光子芯片封拆 (SCIP™) 手艺。

芯片巨头的“新”战场  第3张

博通的光电共封收发器

(图源:博通)

Marvell

Marvell Teralynx 10交换机是另一款专为800GbE时代设想的51.2T交换机,该交换机由Marvell的Teralynx 10 51.2 Tbps交换芯片和 PAM4 1.6 Tbps 光电平台 Nova构成。Teralynx 品牌来自Marvell-Innovium的收买。

Marvell Teralynx 10芯片跟博通的一样,也是一款可编程5nm单片交换机芯片,具有512个112G SerDes,能满足32 x 1.6T、64 x 800G和128 x 400G普遍的交换机设置装备摆设。根据Marvell的说法,一个Teralynx 10代替了12个12.8 Tbps一代,并且在同等容量下能削减80%的功耗。

芯片巨头的“新”战场  第4张

(图源:Marvell)

Teralynx 10利用了Teralynx 独有的通用超低延迟开关和缓冲构造,还撑持拥塞感知路由和实时流遥测,使收集可以主动调整和自我修复。借助线速可编程性,能够添加新的协议和功用来满足AI/ML不竭变革的需求。Teralynx 10 撑持普遍的实时收集遥测,包罗 P4 带内收集遥测 (INT)。那些功用撑持预测阐发、更快的问题处理和更高水平的主动化。

芯片巨头的“新”战场  第5张

(图源:Marvell)

那款新的交换机芯片能够削减AI/ML等散布式应用法式在收集上破费的时间,更大限度地进步计算操纵率,并满足人工智能和机器进修不竭增长的带宽需求。它适用于下一代数据中心收集中的枝叶和主干应用法式,以及 AI/ML 和高性能计算 (HPC) 构造。Teralynx 10将在第二季度供给样品。

思科

思科也在停止光电共封手艺的摸索,其正在和芯片造造商Inphi之间基于CPO的交换机/光学处理计划的合做,为下一代 51.2 Tb/s交换机和800 Gb/s可插拔设备开发结合封拆光学器件 (CPO)。

在本次OFC 2023上,思科也演示了CPO手艺实现的可行性详细步调。思科指出,其Cisco 8111-32EH是一种传统的32端口2x400G 1RU路由器,基于Cisco Silicon One G100 ASIC的2x400G-FR4可插拔光学模块(64x400G FR4)。思科CPO路由器装备了完好的协同封拆的基于硅光子学的光学tiles,驱动64x400G FR4,也基于带CPO衬底的思科Silicon One G100 ASIC。思科还创造了一种在硅光子IC上施行此复用器/解复用器的立异办法。思科估计试验摆设与 51.2Tb 交换机周期同时停止,随后在 101.2Tb 交换机周期内更大规模地接纳。

芯片巨头的“新”战场  第6张

思科在OFC 2023 CPO演示的128x400G FR4 机箱设置装备摆设(图源:思科博客)

英特尔

在光电共封那一手艺上,英特尔是资深的玩家之一。2015年颁布发表推出其co-package photonic手艺。为了供给经济高效的互连处理计划,英特尔不断在增加其硅光子学的带宽,并在不竭摸索利用一体封拆的光学器件。

2019年,Intel收买了以太网交换机芯片和数据中心软件范畴的新兴领军企业Barefoot Networks,2020年3月,英特尔展现了12.8 Tb/s Barefoot Tofino 2交换机与1.6 Tb/s集成光子引擎配合封拆的计划,硅光互连平台接纳1.6 Tbps光子引擎,在Intel硅光平台上设想和造造,可供给4个400GBase-DR4 接口。英特尔暗示,利用一体封拆的光学器件,可将光学端口置于在统一封拆内的交换机附近,从而可降低功耗,并继续连结交换机带宽的扩展才能。英特尔还暗示,其51.2 Tb/s处理计划应该能够在2023岁尾停止贸易摆设,

芯片巨头的“新”战场  第7张

(图源:英特尔)

CPU和GPU厂商的试炼

相信英特尔如斯努力于硅光研究不是仅仅为了能与交换机新芯片共连,将来光学器件若是能否与CPU、GPU或XPU集成在一路也不得而知。

我们看到,英特尔破费了很大的心力,从多种途径停止对光互联手艺的撑持。2022年6月30日,英特尔研究院展现了完全集成在硅晶圆上的八波长散布式反应(DFB),激光器阵列,该阵列输出功率平均性到达+/- 0.25分贝(dB),波长间隔平均性抵达±6.5%,那项最新的光电共封拆处理计划利用了密集波分复用(DWDM)手艺,展示了在增加带宽的同时显著缩小光子芯片尺寸的前景。并且更重要的是,它是在英特尔的商用300 mm混合硅光子平台设想和造造的,因而,它为下一代光电共封拆和光互连器件的量产供给了一条明晰的途径。

在2022年英特尔On峰会上,英特尔又展现了其正在开发的一项立异:在可插拔式光电共封拆(pluggable co-package photonics)处理计划上的打破。英特尔的研究人员设想了一种巩固的、高良率的、玻璃材量的处理计划,它通过一个可插拔的毗连器简化了造造过程,降低了成本,为将来新的系统和芯片封拆架构开启了全新可能。

英特尔可插拔毗连器

(图源:英特尔)

英伟达也看中了光互连的潜力,互连的 GPU 将受益于低延迟数据传输和显着削减的信号丧失。Nvidia或将鄙人一代 NVSwitch上施行结合封拆光学器件以实现节点间通信,那些系统应该在互连的NVLink 收集中撑持约4,000个GPU。

芯片巨头的“新”战场  第8张

英伟达展现光学链接GPU系统的外不雅

(图源:英伟达)

英伟达正在集各方之力鞭策那一手艺的施行。据台媒报导,业内动静人士透露,台积电参与了由Nvidia牵头的研发项目,该项目将其称为 COUPE(紧凑型通用光子引擎)的硅光子 (SiPh) 集成手艺用于图形硬件,以组合多个 AI GPU。

在2023年的OFC会上,Ayar Labs展现了业界首个4太比特/秒(Tbps)双向波分复用(WDM)光学处理计划。而NVIDIA 的加速计算平台恰是由WDM光学互连等先辈手艺撑持,英伟达希望通过光互连为AI供给“下一个百万倍”加速。Nvidia还参与了Ayar Labs去年的C轮融资,其时它筹集1.3亿美圆用于开发其带外激光器和硅光子互连。两家公司方案配合加速光学I/O手艺的开发和接纳,以撑持 AI 和机器进修 (ML) 应用法式和数据量的爆炸式增长。

光电共封手艺贸易化还有诸多挑战

但是,光电共封手艺要获得大规模的贸易化还需要处理多个挑战,它必需可靠、可维修、可摆设、可显著节能而且具有成本效益。固然光互连有望让芯片间的带宽到达更高程度,出格是在数据中心内部,但造造上的困难使其成本昂扬到难以接受。

挑战一,CPO手艺严峻依赖于硅光子学手艺,需要将光学元件小型化以适应 ASIC 封拆(体积比传统 QSFP-DD 或 OSFP 模块小 100 多倍)。我们看到,专有的CPO计划起首呈现在Broadcom、Intel、Marvell和其他一些公司,那些供给商大多已经收买或与立异的硅光子公司合做。他们在那一手艺上的积累和勤奋,使得CPO的贸易化垂垂成为可能。

另一方面,跟着光学和硅芯片的高度集成,新的工程才能和晶圆代工场将长短常需要的。

在那方面,格芯是一个比力具有前瞻的代工场。自从退出芯片先辈造程的逃逐后,格芯不断在摸索其他手艺,硅光子恰是格芯押注大筹码的一项手艺。2015 年格芯收买了IBM Microelectronics 的一部门,因而也从IBM Research 获得了光子学专业常识和常识产权。2016年,格芯就推出了其第一代硅光子平台,并在同年创建了一个独立的硅光子营业。其时带宽的行业尺度是仅为40 GB/s。格芯打赌将来行业将不能不操纵光的力量在全球各地涌现的数据中心内部和之间挪动大量数据。事实证明,确实如斯,现在数据中心的带宽已来到400 GB/s和800 GB/s的数据速度。

GF Fotonix 是格芯为硅光子芯片打造的一个整体的平台,那也是业界独一的硅光子多量量 300mm CMOS造造代工场。按照格芯的介绍,该平台将光子元件与高性能CMOS逻辑和RF集成在一路,以实现完全集成的单片电气和光学计算和通信引擎,同时针对低信号损耗降级停止了优化。此外,格芯单片硅光子平台的光输入和光输出可通过高密度光纤阵列、片上集成激光器和铜金属化实现与其他半导体芯片的 2.5D 和 3D 异构集成。

芯片巨头的“新”战场  第9张

位于纽约马耳他的Fab8是格芯GF Fotonix芯片的消费地

芯片巨头如Broadcom、思科、Marvell和NVIDIA以及Ayar Labs、Lightmatter、PsiQuantum、Ranovus 和 Xanadu 在内的光子计算范畴的厂商都与格芯有着亲近的交换合做。此外,EDA软件厂商Ansys、Cadence和Synopsys等也正在供给撑持基于集成硅光子学的芯片和小芯片的设想东西。

写在最初

总而言之,光电共封的处理计划确实使得新一代的交换机与前几代比拟发作了很大的打破,但是如文中所述,CPO要成为支流还有诸多因素要克制,据Yole阐发师的说法,虽然CPO具有手艺优势,但它将很难与可插拔模块合作,在很长一段时间内,可插拔模块仍将是首选。可插拔、OBO和CPO将共存一段时间。

图源:Yole

如今,光学器件能够与以太网交换机芯片配合封拆,将来,它能否与CPU、GPU或XPU集成在一路也或许是一个探究标的目的。在摩尔定律动力不敷的情况下,光电共封那项手艺正在崭露其潜力,从另一条新道路上来满足当下数据量兴旺开展的处置需求。并且很重要的一个趋向是,次要的芯片巨头们都在排兵布阵,光电共封手艺正在向我们走进。