从铜的物理极限到CPO架构革命,一场围绕“光”的产业链重构正在发生
AI大模型训练,动辄需要上万张GPU协同工作。这些GPU之间每秒钟要交换海量数据,相当于几万部高清电影瞬间搬完。
但很多人不知道的是,拖慢这场算力狂欢的,不是芯片本身,而是连接它们的“线”。
当单通道速率从112G爬到224G,再向448G挺进时,传统的铜缆连接器正逼近物理极限。信号在铜线里跑不了多远就会衰减到不可辨认。于是,一个共识在产业界迅速形成:用光来代替电。
但光的问题在于——它现在还太贵、太复杂、太耗能。AI的瓶颈,正从“算力”转移到“光力”。
一、铜的物理极限:为什么必须用光?
铜缆连接器有几大优点:便宜、成熟、可靠性高。在AI服务器机柜内部,只要能用电,就没人想用光。
但问题出在距离和速率上。224G信号在铜缆中跑不到几米就严重失真,到了448G,有效距离进一步缩短。而AI集群规模越来越大,GPU之间的物理距离正在拉长。
铜缆面临的三大物理极限:
趋肤效应:高频信号只沿导体表面传输,阻抗剧增
介质损耗:绝缘材料在高频下吸收能量,信号迅速衰减
串扰:相邻通道间的电磁干扰在高频下急剧恶化
工程师们想了很多办法——加粗线径、优化材料、引入有源补偿——但本质上都是在“续命”。产业界逐渐达成共识:中长距离的AI互连,必须交给光。
二、光通信产业链:谁在掌控这条命脉?
光通信并不是新技术,电信骨干网用光传输已经几十年了。但当它要进入数据中心、进入服务器机柜、甚至进入芯片封装内部时,整个产业链都在被重新定义。
我们可以把这条链拆成四层来看:
第一层:光芯片——最贵也最卡脖子
光芯片是光模块的心脏,负责把电信号变成光信号,再把光信号变回来。它占光模块成本的40%-60%,也是技术壁垒最高的环节。
目前高速光芯片(如25GBaud以上的激光器和探测器)主要被美国和日本企业掌控。国内企业在中低速率产品上已有规模出货,但在56GBaud、112GBaud这个级别,自给率仍然很低。
第二层:电芯片——光模块的“大脑”
电芯片负责信号的调制、驱动和处理,与光芯片配合工作。DSP(数字信号处理)芯片是光模块中最核心、功耗最高的电芯片。
这个领域长期被Marvell、博通等国际大厂主导。国内已有企业在部分品类上实现突破,但总体仍有差距。
第三层:光模块——直接面向客户的成品
光模块是将光芯片、电芯片、光学元件封装在一起的产品。中国企业在全球光模块市场已经占据重要份额,中际旭创、光迅科技、新易盛等都是主要玩家。
800G光模块已批量供货,1.6T产品正在密集送样验证阶段。这一层也是目前国产化程度最高的环节。
第四层:光连接器与线缆——容易被忽视的关键一环
光连接器负责把光模块和光纤精准对接。MT/MPO多芯连接器、LC/SC单芯连接器等,是光链路的最后物理接口。
这个环节看似不起眼,但对精度和可靠性的要求极高。一个对不准的光连接器,足以让整条光链路报废。
三、CPO:一场正在发生的架构革命
如果只是把铜缆换成光纤,瓶颈依然存在。因为信号从GPU出来,要经过PCB走线、连接器、光模块内部处理,每一步都在损失信号质量、增加功耗和延迟。
于是,一个更激进的技术路线被提了出来:CPO——共封装光学。
传统架构中,光模块插在面板上,通过PCB走线连接到交换芯片。CPO的做法是:把光引擎直接封装到交换芯片的基板上。信号从芯片出来,几乎是零距离进入光引擎。
这意味着三件事同时发生:
功耗大幅下降:去掉了光模块中的DSP芯片,信号调理的功耗被砍掉大半
延迟降至纳秒级:信号不需要再经过PCB走线和连接器
带宽密度成倍提升:芯片周围的物理空间被充分利用
目前,博通、英特尔、Marvell等芯片巨头,以及中际旭创、光迅科技等光模块企业,都在积极布局CPO。部分产品已在超大规模数据中心进入试用阶段。
但CPO也有挑战。最直接的问题就是可维护性。传统光模块坏了可以随时拔插更换,CPO把光引擎焊死在芯片旁,一旦出问题,更换的是整块主板甚至整个机箱。这需要整个产业链从前端维护到后端运维全面适配。
四、重构中的产业链:机会与挑战
CPO带来的不只是一个新产品,而是整个产业链的重构。
对光芯片企业:需求从“多通道、独立封装”转向“更高密度、更低功耗”,技术门槛进一步提高。
对光模块企业:传统光模块业务可能被CPO部分取代,但代工CPO光引擎本身也是新业务。关键在于能不能从“卖模块”转向“卖能力”。
对连接器企业:这是挑战也是机遇。CPO减少了面板级光连接器的用量,但芯片与光纤之间的高精度对准,本身就是一种新的“连接需求”。谁能解决这个问题,谁就能继续留在牌桌上。
对设备商和云厂商:CPO需要整机柜甚至整个数据中心的协同设计,硬件、散热、运维、软件调度需要一体化规划。这将进一步推高头部玩家的竞争壁垒。
五、几点思考
第一,光正在从“通信技术”变成“计算技术”。以前光纤是电信网的事,现在它直接决定了GPU集群能搭多大、跑多快。从这个意义上说,光已经成了AI基础设施的“内环组件”。
第二,CPO是一场不可逆的趋势,但节奏不会太快。可维护性问题、产业链配套、客户信任度都需要时间。铜缆连接器在中短期内仍将是机柜内部互连的主力。
第三,连接器人不要怕“光进铜退”。准确地说,是“光进铜不退”。芯片间、板间的超短距互连,铜缆依然是最优解。而且,光连接器本身也是一个正在爆发的新品类。关键是能不能跟住技术路线,提前卡位。
AI的终极瓶颈,或许不是算力,也不是功耗,而是数据在芯片与芯片之间能跑多快、跑多稳。谁解决了这个问题,谁就能拿到通往下一代AI基础设施的钥匙。
光,正在成为这把钥匙。
夜雨聆风