当电信号跑到物理极限,光就成为唯一的出路。2026年6月,英伟达正式量产全球首款CPO交换机,标志着数据中心互联从"铜线时代"迈入"硅光时代"。
一、从可插拔到共封装:为什么必须"革自己的命"?
过去二十年,数据中心的光模块一直以**可插拔(Pluggable)**形态存在——光模块插在交换机面板上,通过PCB铜走线与交换芯片相连。这种架构简单、灵活、可替换,构成了整个互联网基础设施的物理层底座。
但AI大模型的爆发式增长,正在把这个架构逼到墙角。
一台典型的51.2T交换机,64个800G端口的光模块功耗就超过200W,占总系统功耗的30%以上。更致命的是,当数据传输速率从112Gbps/lane向224Gbps/lane迈进时,信号在PCB铜走线上传输10到20厘米后衰减已极其严重,必须用复杂的DSP均衡算法强行"续命",功耗随之指数级飙升——这就是业界所说的**"铜互连墙"(Copper Interconnect Wall)**。
**CPO(Co-Packaged Optics,光电共封装)**的核心思路简单到近乎粗暴:把光引擎直接"贴"到交换芯片旁边,让电信号的传输距离从厘米级压缩到毫米级甚至微米级。光模块不再是插在面板上的独立设备,而是和交换ASIC共同封装在同一块基板上的"邻居"。
二、台积电COUPE:藏在英伟达交换机里的"俄罗斯套娃"
英伟达此次量产的Spectrum-X硅光交换机,核心技术底座来自台积电的**COUPE(Compact Universal Photonic Engine,紧凑通用光子引擎)**平台。
COUPE的精髓在于SoIC-X 3D混合键合(Hybrid Bonding)。简单来说,它将两颗芯片——电子集成电路(EIC)和光子集成电路(PIC)——像叠俄罗斯套娃一样垂直堆叠在一起。EIC负责驱动和信号处理,PIC负责调制和传输光信号,两者通过无凸点的铜对铜直接键合实现电连接,互连间距小于10微米。
这个"叠"字看似简单,实则暗藏玄机。传统方案中EIC和PIC是水平排列的,两者之间仍需走线连接,信号损耗不可忽视。而垂直堆叠将电-光转换界面压缩到近乎为零的距离,大幅降低了耦合损耗。台积电官方数据显示,COUPE方案的系统能效可以做到传统铜互连方案的10倍,延迟降低20倍。
更精妙的是,PIC一侧同时集成了微环调制器(MRM)和马赫-曾德尔调制器(MZM)两种调制方案。MRM体积小、密度高,适合大规模并行通道;MZM速度快、功率大,适合高要求的骨干链路。"Universal"之名,正源于此——一套平台覆盖多种应用场景。
三、能效革命:从"电老虎"到"省电标兵"
CPO带来的能效提升是数量级的。
当前主流的800G可插拔光模块,单端口功耗约14到16W。英伟达Spectrum-X CPO交换机将这一数字压到了5.2到5.6W,降幅达60%到68%。换算到系统层面,一台409.6Tbps的SN6600交换机(512个800G端口),仅光互连部分就节省超过4500W——相当于省掉了一台家用空调的满负荷功耗。
这背后是物理规律的胜利:当电信号只需走亚毫米级的距离,驱动电流大幅降低,SerDes也不再需要做复杂的信号补偿,整个发射端可以砍掉大量耗电电路。业界将此称为**"DSP-lite"甚至"DSP-less"架构**——从前光模块里最耗电的就是那块DSP芯片,现在它要么被精简到极致,要么干脆消失。
对AI数据中心而言,这意味着什么?以10万卡GPU集群为例,仅网络交换层每年可节省的电力成本就数以千万美元计。更重要的是,省下的功耗可以用来部署更多GPU,直接转化为有效算力。
四、产业链重构:谁赢谁输?
CPO的登场不是简单的技术升级,而是一次产业链的重新洗牌。
在传统可插拔方案中,光模块是一个独立产业,中际旭创、Coherent、Lumentum等厂商拥有完整的研发、生产和定价权,客户(如英伟达、Meta)买来即插即用。但在CPO架构下,光引擎成为交换芯片封装的"附属品",必须由先进封装厂(台积电、SPIL)在同一流程中完成集成。光模块厂商的角色从"产品提供商"退化为"组件供应商"——这是一个根本性的权力转移。
英伟达的供应链图谱清晰地展示了这种变化:硅光制造由台积电负责,芯片级封装和测试交给SPIL(矽品),激光芯片来自TFC,系统组装由富士康完成。传统光模块巨头Coherent和Lumentum虽然也拿到了约40亿美元的长期供应协议,但交付的不再是完整模块,而是硅光引擎和激光器组件的"半成品"。
对于中国光模块产业而言,这是一个既危险又充满机遇的信号。危险在于,如果CPO最终替代大部分可插拔需求,中国厂商在800G/1.6T可插拔模块上积累的竞争优势将面临结构性削弱。机遇则在于,硅光芯片设计、先进封装代工、光引擎测试等新兴环节正在催生新的入局机会——佰维存储已经以"OEC高速光电互联封装"切入CPO代工赛道,就是一个值得关注的案例。
值得注意的是,CPO市场并非英伟达一家独大。**博通(Broadcom)**的Tomahawk 6(代号"Davisson")交换芯片同样已进入102.4Tbps量产出货阶段,Meta已验证其超过100万小时无故障运行。英伟达走的是"全栈垂直整合"路线——从GPU到NVLink到Spectrum-X交换机自成一派;博通则延续"水平开放"策略,将CPO交换芯片卖给各家系统厂商。两种模式的较量,将深刻影响CPO生态的最终形态。
此外,大立光在COMPUTEX 2026上首次跨界展示了CPO光学模组方案——多通道微透镜阵列加光纤阵列,仅用8个月就完成从模具开发到客户送样,彰显了光学镜头厂商切入硅光赛道的可能性。Molex也在6月初完成了对以色列Teramount公司的收购,将其"可拆卸光纤到芯片耦合"技术收入囊中,试图打通CPO量产的最后一道封装瓶颈。产业边界的消融与重构,正在加速。
五、NPO:CPO的"务实版"过渡方案
CPO虽然能效惊人,但有一个硬伤——不可维护。传统光模块坏了,运维人员可以热插拔更换,几分钟搞定。CPO的光引擎直接焊死在封装里,一旦出问题就得更换整块交换线卡,运维成本和故障影响范围都大幅放大。
**NPO(Near-Package Optics,近封装光学)**就是为平衡这个矛盾而生的折中方案。它把光引擎放在离交换芯片非常近的位置(但不在同一封装内),功耗降至约9W/模块(比可插拔的30W大幅降低,虽不如CPO的<2W极限),同时保留了基本的可维护性。
业界普遍认为,2026到2027年NPO将迎来爆发性增长,作为从可插拔到CPO的"中间态"填补过渡期的需求。而CPO真正大规模渗透(超过50%新部署占比)可能要等到2028年之后。三者在数据中心内部将形成分层共存的格局:AI训练的超大规模集群用CPO追求极致能效,通用云服务的架顶交换机继续用可插拔保证灵活性,NPO卡在中间吃下最大的增量市场。
六、光进铜退:一场不可逆的物理竞赛
回头看,CPO的崛起遵循了一条清晰的物理逻辑线。
铜互连在短距离上仍然是最优解,但当数据传输速率突破100Gbps/lane后,铜的物理特性开始成为不可逾越的障碍——趋肤效应、介质损耗、串扰,每一项都在吞噬信号完整性。光在这些维度上是"降维打击":光纤的无损耗传输、天然的抗电磁干扰能力、近乎无限的带宽潜力,唯一的代价是电-光-电转换环节的额外功耗。
CPO的精妙之处就在于,它通过物理上将电芯片和光芯片"贴"到最近,让这个转换环节的功耗降到几乎可以忽略的水平。当电-光转换不再是瓶颈,光互连的固有优势——海量带宽、无损传输、天然抗干扰——就毫无保留地释放出来。
这也就是为什么台积电会把硅光层称为AI芯片"三层蛋糕"中"最重要的那一层"。计算层和3D集成层解决的是"算得快"的问题,而光子层解决的是"通得快"的问题。在万亿参数模型和百万卡集群的时代,"通"正在成为比"算"更稀缺的资源。
结语
2026年被公认为**"CPO产业化元年"**。英伟达Spectrum-X的量产、台积电COUPE的商用、博通Tomahawk 6 102.4T交换机的出货,三重信号叠加,宣告了一个新时代的开启。
但"元年"不是"终结年"。CPO从第一代量产到成为数据中心的默认选项,至少还需要3到5年的工程迭代——良率爬坡、成本下探、测试标准化、生态构建、可靠性验证,每一步都不轻松。可插拔光模块在2030年前仍将占据部署量的主体,三足鼎立的格局会持续相当长的时间。
对于中国半导体产业而言,CPO既是挑战也是机遇。挑战在于,先进封装(尤其是混合键合)正是中国产业链的薄弱环节;机遇在于,硅光子芯片设计这个新赛道还没有出现绝对的垄断者,而中国在光通信领域拥有全球最完整的产业生态。能不能抓住"光进铜退"的历史窗口,把硅光打造成下一个"中国优势"领域,值得持续关注。
发布日期:2026年6月4日
参考来源:NVIDIA官方博客、TSMC硅光子论坛、TrendForce、LightCounting、Pandaily等行业分析报告
夜雨聆风