CPO光电共封装:AI数据中心的光互联革命

当电信号跑到物理极限，光就成为唯一的出路。2026年6月，英伟达正式量产全球首款CPO交换机，标志着数据中心互联从"铜线时代"迈入"硅光时代"。

一、从可插拔到共封装：为什么必须"革自己的命"？

过去二十年，数据中心的光模块一直以**可插拔（Pluggable）**形态存在——光模块插在交换机面板上，通过PCB铜走线与交换芯片相连。这种架构简单、灵活、可替换，构成了整个互联网基础设施的物理层底座。

但AI大模型的爆发式增长，正在把这个架构逼到墙角。

一台典型的51.2T交换机，64个800G端口的光模块功耗就超过200W，占总系统功耗的30%以上。更致命的是，当数据传输速率从112Gbps/lane向224Gbps/lane迈进时，信号在PCB铜走线上传输10到20厘米后衰减已极其严重，必须用复杂的DSP均衡算法强行"续命"，功耗随之指数级飙升——这就是业界所说的**"铜互连墙"（Copper Interconnect Wall）**。

**CPO（Co-Packaged Optics，光电共封装）**的核心思路简单到近乎粗暴：把光引擎直接"贴"到交换芯片旁边，让电信号的传输距离从厘米级压缩到毫米级甚至微米级。光模块不再是插在面板上的独立设备，而是和交换ASIC共同封装在同一块基板上的"邻居"。

二、台积电COUPE：藏在英伟达交换机里的"俄罗斯套娃"

英伟达此次量产的Spectrum-X硅光交换机，核心技术底座来自台积电的**COUPE（Compact Universal Photonic Engine，紧凑通用光子引擎）**平台。

COUPE的精髓在于SoIC-X 3D混合键合（Hybrid Bonding）。简单来说，它将两颗芯片——电子集成电路（EIC）和光子集成电路（PIC）——像叠俄罗斯套娃一样垂直堆叠在一起。EIC负责驱动和信号处理，PIC负责调制和传输光信号，两者通过无凸点的铜对铜直接键合实现电连接，互连间距小于10微米。

这个"叠"字看似简单，实则暗藏玄机。传统方案中EIC和PIC是水平排列的，两者之间仍需走线连接，信号损耗不可忽视。而垂直堆叠将电-光转换界面压缩到近乎为零的距离，大幅降低了耦合损耗。台积电官方数据显示，COUPE方案的系统能效可以做到传统铜互连方案的10倍，延迟降低20倍。

更精妙的是，PIC一侧同时集成了微环调制器（MRM）和马赫-曾德尔调制器（MZM）两种调制方案。MRM体积小、密度高，适合大规模并行通道；MZM速度快、功率大，适合高要求的骨干链路。"Universal"之名，正源于此——一套平台覆盖多种应用场景。

三、能效革命：从"电老虎"到"省电标兵"

CPO带来的能效提升是数量级的。

当前主流的800G可插拔光模块，单端口功耗约14到16W。英伟达Spectrum-X CPO交换机将这一数字压到了5.2到5.6W，降幅达60%到68%。换算到系统层面，一台409.6Tbps的SN6600交换机（512个800G端口），仅光互连部分就节省超过4500W——相当于省掉了一台家用空调的满负荷功耗。

这背后是物理规律的胜利：当电信号只需走亚毫米级的距离，驱动电流大幅降低，SerDes也不再需要做复杂的信号补偿，整个发射端可以砍掉大量耗电电路。业界将此称为**"DSP-lite"甚至"DSP-less"架构**——从前光模块里最耗电的就是那块DSP芯片，现在它要么被精简到极致，要么干脆消失。

对AI数据中心而言，这意味着什么？以10万卡GPU集群为例，仅网络交换层每年可节省的电力成本就数以千万美元计。更重要的是，省下的功耗可以用来部署更多GPU，直接转化为有效算力。

四、产业链重构：谁赢谁输？

CPO的登场不是简单的技术升级，而是一次产业链的重新洗牌。

在传统可插拔方案中，光模块是一个独立产业，中际旭创、Coherent、Lumentum等厂商拥有完整的研发、生产和定价权，客户（如英伟达、Meta）买来即插即用。但在CPO架构下，光引擎成为交换芯片封装的"附属品"，必须由先进封装厂（台积电、SPIL）在同一流程中完成集成。光模块厂商的角色从"产品提供商"退化为"组件供应商"——这是一个根本性的权力转移。

英伟达的供应链图谱清晰地展示了这种变化：硅光制造由台积电负责，芯片级封装和测试交给SPIL（矽品），激光芯片来自TFC，系统组装由富士康完成。传统光模块巨头Coherent和Lumentum虽然也拿到了约40亿美元的长期供应协议，但交付的不再是完整模块，而是硅光引擎和激光器组件的"半成品"。

对于中国光模块产业而言，这是一个既危险又充满机遇的信号。危险在于，如果CPO最终替代大部分可插拔需求，中国厂商在800G/1.6T可插拔模块上积累的竞争优势将面临结构性削弱。机遇则在于，硅光芯片设计、先进封装代工、光引擎测试等新兴环节正在催生新的入局机会——佰维存储已经以"OEC高速光电互联封装"切入CPO代工赛道，就是一个值得关注的案例。

值得注意的是，CPO市场并非英伟达一家独大。**博通（Broadcom）**的Tomahawk 6（代号"Davisson"）交换芯片同样已进入102.4Tbps量产出货阶段，Meta已验证其超过100万小时无故障运行。英伟达走的是"全栈垂直整合"路线——从GPU到NVLink到Spectrum-X交换机自成一派；博通则延续"水平开放"策略，将CPO交换芯片卖给各家系统厂商。两种模式的较量，将深刻影响CPO生态的最终形态。

此外，大立光在COMPUTEX 2026上首次跨界展示了CPO光学模组方案——多通道微透镜阵列加光纤阵列，仅用8个月就完成从模具开发到客户送样，彰显了光学镜头厂商切入硅光赛道的可能性。Molex也在6月初完成了对以色列Teramount公司的收购，将其"可拆卸光纤到芯片耦合"技术收入囊中，试图打通CPO量产的最后一道封装瓶颈。产业边界的消融与重构，正在加速。

五、NPO：CPO的"务实版"过渡方案

CPO虽然能效惊人，但有一个硬伤——不可维护。传统光模块坏了，运维人员可以热插拔更换，几分钟搞定。CPO的光引擎直接焊死在封装里，一旦出问题就得更换整块交换线卡，运维成本和故障影响范围都大幅放大。

**NPO（Near-Package Optics，近封装光学）**就是为平衡这个矛盾而生的折中方案。它把光引擎放在离交换芯片非常近的位置（但不在同一封装内），功耗降至约9W/模块（比可插拔的30W大幅降低，虽不如CPO的<2W极限），同时保留了基本的可维护性。

业界普遍认为，2026到2027年NPO将迎来爆发性增长，作为从可插拔到CPO的"中间态"填补过渡期的需求。而CPO真正大规模渗透（超过50%新部署占比）可能要等到2028年之后。三者在数据中心内部将形成分层共存的格局：AI训练的超大规模集群用CPO追求极致能效，通用云服务的架顶交换机继续用可插拔保证灵活性，NPO卡在中间吃下最大的增量市场。

六、光进铜退：一场不可逆的物理竞赛

回头看，CPO的崛起遵循了一条清晰的物理逻辑线。

铜互连在短距离上仍然是最优解，但当数据传输速率突破100Gbps/lane后，铜的物理特性开始成为不可逾越的障碍——趋肤效应、介质损耗、串扰，每一项都在吞噬信号完整性。光在这些维度上是"降维打击"：光纤的无损耗传输、天然的抗电磁干扰能力、近乎无限的带宽潜力，唯一的代价是电-光-电转换环节的额外功耗。

CPO的精妙之处就在于，它通过物理上将电芯片和光芯片"贴"到最近，让这个转换环节的功耗降到几乎可以忽略的水平。当电-光转换不再是瓶颈，光互连的固有优势——海量带宽、无损传输、天然抗干扰——就毫无保留地释放出来。

这也就是为什么台积电会把硅光层称为AI芯片"三层蛋糕"中"最重要的那一层"。计算层和3D集成层解决的是"算得快"的问题，而光子层解决的是"通得快"的问题。在万亿参数模型和百万卡集群的时代，"通"正在成为比"算"更稀缺的资源。

结语

2026年被公认为**"CPO产业化元年"**。英伟达Spectrum-X的量产、台积电COUPE的商用、博通Tomahawk 6 102.4T交换机的出货，三重信号叠加，宣告了一个新时代的开启。

但"元年"不是"终结年"。CPO从第一代量产到成为数据中心的默认选项，至少还需要3到5年的工程迭代——良率爬坡、成本下探、测试标准化、生态构建、可靠性验证，每一步都不轻松。可插拔光模块在2030年前仍将占据部署量的主体，三足鼎立的格局会持续相当长的时间。

对于中国半导体产业而言，CPO既是挑战也是机遇。挑战在于，先进封装（尤其是混合键合）正是中国产业链的薄弱环节；机遇在于，硅光子芯片设计这个新赛道还没有出现绝对的垄断者，而中国在光通信领域拥有全球最完整的产业生态。能不能抓住"光进铜退"的历史窗口，把硅光打造成下一个"中国优势"领域，值得持续关注。

发布日期：2026年6月4日

参考来源：NVIDIA官方博客、TSMC硅光子论坛、TrendForce、LightCounting、Pandaily等行业分析报告