飞焦级全光开关:千倍能效AI芯片的技术突破

摘要：本文深入解析4飞焦级全光开关技术突破，揭秘激子极化激元如何破解光子交互难题，对比CMOS、存算一体等主流技术性能差异，分析该技术如何将AI芯片能效提升2000倍，为全光AI芯片、量子计算落地铺平道路，探讨光子计算如何破解当前AI的功耗墙困局。

引言：AI算力扩张下的能效困局

随着生成式AI的爆发，大语言模型、多模态模型的参数规模以指数级增长，这给底层硬件带来了前所未有的压力。根据行业数据，当前训练一个万亿参数的大模型，需要消耗超过300MWh的电能，而全球AI数据中心的能耗已经占到全球电力消耗的2%以上，并且仍在快速增长。

传统的电子芯片正在逼近物理极限：摩尔定律的放缓使得晶体管微缩的红利逐渐消失，而冯・诺依曼架构下，数据在计算单元与存储单元之间的频繁搬运，消耗了系统90%以上的能量，这就是所谓的“内存墙”与“功耗墙”。

为了突破这一瓶颈，业界将目光投向了光子计算——用光而非电子来处理信息。光子的传播速度更快、发热更少，理论上可以实现比电子芯片高几个数量级的能效与速度。但长期以来，全光计算面临一个核心难题：光子之间几乎不会发生相互作用，这使得我们很难用光来控制光，实现类似电子开关的逻辑操作，这也成为了全光芯片实用化的最大障碍。

近日，来自宾夕法尼亚大学与蒙大拿州立大学的研究团队在《PhysicalReviewLetters》上发表了一项突破性研究，他们基于二维材料与纳米光腔，实现了能耗仅为4飞焦（fJ）的全光开关，将全光开关的能耗门槛降到了前所未有的水平，为大规模全光AI芯片的落地铺平了道路。

一、核心技术分析：半光半物质的激子极化激元，破解光子交互难题

要实现全光计算，最核心的组件就是全光开关：它能让一个光信号控制另一个光信号的通断，就像电子开关控制电流一样，这是实现所有逻辑运算与信号处理的基础。

但光子的“冷漠”是最大的阻碍：在常规条件下，光子之间不会发生相互作用，一个光子的传播不会影响另一个光子。为了让光子能够“互动”，研究团队引入了一种特殊的准粒子——激子极化激元（ExcitonPolaritons）。

1. 半光半物质的准粒子，继承两者优势

激子极化激元是一种“半光半物质”的混合粒子：当光子和半导体中的激子（电子-空穴对）发生强耦合时，就会形成这种新的准粒子。它同时继承了光子与激子的优势：

作为“光”的部分，它可以以光速传播，信号延迟极低，带宽极大；
作为“物质”的部分，它可以通过其中的激子部分实现粒子间的强相互作用，这就间接让光子之间产生了交互能力。

为了实现这种强耦合，研究团队选择了单层二硒化钼（MoSe₂）——一种典型的二维半导体材料。这种原子级厚度的材料有着极高的激子结合能，能够在室温下稳定存在激子，不需要复杂的低温环境，这为器件的实用化打下了基础。

2. 纳米光腔：把光“锁”在纳米空间，放大相互作用

仅仅有二维材料还不够，为了进一步增强光子与激子的耦合强度，研究团队将MoSe₂单层与光子晶体纳米腔集成在了一起。

这种纳米腔是一种纳米级的“光陷阱”，它可以把光紧紧地限制在亚波长的极小空间里，让光子和MoSe₂中的激子有更长的相互作用时间，从而极大地增强了两者的耦合效率，也放大了粒子间的相互作用强度。

图1：研究团队设计的器件结构，入射光进入氮化硅纳米梁腔后，与单层MoSe₂中的激子发生强耦合，形成激子极化激元，从而实现光子间的有效交互。

通过这种设计，研究团队成功将全光开关的能耗降到了4飞焦（4×10⁻¹⁵J），这是目前全光开关领域的最新纪录，比传统的硅基全光开关的能耗低了两个数量级以上。

“我们的设计把极化激元限制在亚波长的极小空间里，这极大地增强了粒子间的相互作用强度，让我们得以在创纪录的低功率下实现开关操作，只需要消耗大约4飞焦的能量。”该研究的资深作者、蒙大拿州立大学的LiHe助理教授解释道。

二、深度对比：全光开关与传统技术的性能鸿沟

这项研究的突破，不仅仅是一个数字的提升，它让全光开关的性能第一次具备了和主流电子芯片技术竞争的能力，甚至在很多维度上实现了超越。我们将这项技术与当前主流的计算开关技术做了横向对比：

技术类型	典型开关能耗	工作带宽	集成兼容性	核心优势	核心短板
7nmCMOS电子开关	~1-10aJ	~1-10GHz	完全成熟	工艺成熟、成本低	带宽有限、传输能耗高
传统硅基全光开关	~1-10pJ	~100GHz+	中等	速度快、光信号兼容	能耗过高，难以大规模集成
忆阻器（存算一体）	~10-100fJ	~1-100GHz	中等	解决内存墙、边缘AI友好	速度有限、可靠性待提升
本研究：2D材料激子极化激元光开关	4fJ	~THz级	中等（兼容标准制造工艺）	超低能耗、超高带宽、光原生	尚处于实验室验证阶段

从对比中我们可以看到：

能耗的跨越式进步：和传统的硅基全光开关相比，这项技术把能耗从皮焦（pJ）级降到了飞焦（fJ）级，降低了超过100倍，这意味着同样的能耗下，全光芯片可以处理超过100倍的计算任务。
速度的代际优势：光开关的工作带宽可以达到THz级别，这是传统电子开关的100倍以上，这对于AI大模型所需要的超高带宽数据处理来说，是不可替代的优势——比如处理Transformer中的注意力机制，超高带宽可以极大地缩短处理延迟。
量产的可行性：和很多实验室里的新奇器件不同，这项技术的制造工艺是兼容现有的半导体标准制造技术的，这意味着它可以大规模集成，在一个芯片上制造数千个这样的光开关，组成复杂的光计算电路，而不需要重新搭建全新的产线。

三、对未来AI硬件的重构：从能效到架构的全面升级

这项全光开关的突破，不仅仅是一个组件的进步，它将从根本上重构未来AI硬件的架构，解决当前AI芯片面临的核心痛点。

1. 破解AI的功耗困局，实现千倍能效提升

当前的AI芯片，不管是GPU还是NPU，最大的痛点就是能耗：数据在计算单元和内存之间的搬运，占了整个系统90%以上的能耗。而全光计算架构下，光信号可以在芯片内直接传输，不需要进行光电转换，也不需要长距离的电信号互连，这就从根本上消除了数据搬运的能耗。

根据研究团队的测算，基于这种开关的全光AI系统，在特定的AI任务中，能效可以达到传统电子芯片的2000倍以上，这和之前的存算一体技术的提升幅度相当，但速度却要快得多。这意味着，未来训练一个大模型，只需要消耗现在1/2000的电能，这将彻底解决AI的能耗危机，让大模型可以在边缘设备上运行，而不需要依赖云端的数据中心。

2. 为神经形态光子芯片提供核心组件

这种全光开关非常适合神经形态（Neuromorphic）计算架构：它的非线性响应特性，和生物神经元的激活函数非常相似，而且可以实现超低能耗的脉冲信号处理。这意味着我们可以用光子来模拟大脑的神经网络，实现比电子神经形态芯片更快、更高效的脑启发计算。

3. 同时支撑量子计算的未来

更有意思的是，这项技术的潜力不止于经典计算。研究团队表示，他们接下来的目标是把开关的能耗再降低几个数量级，做到单光子级别——也就是一个光子就可以控制另一个光子。这正是量子计算所需要的核心组件：量子逻辑门。

如果实现了单光子的全光开关，那么这个平台就可以同时支撑经典的全光AI计算和量子计算，这将为未来的融合计算架构打下基础。

四、挑战与未来：从实验室到量产的最后一公里

当然，这项技术目前还处于早期的实验室验证阶段，要真正实现大规模的商用全光AI芯片，还有不少挑战需要解决：

规模化集成的验证：目前研究团队只验证了单个开关的性能，接下来需要把多个开关集成在一起，组成复杂的光电路，验证大规模集成后的性能与可靠性。
进一步降低能耗：虽然4飞焦已经是纪录，但研究团队认为这还不是物理极限，他们还有明确的路径把能耗再降低几个数量级，做到单光子的量子regime，这需要进一步优化纳米结构的设计。
良率与成本的优化：虽然工艺兼容标准制造，但二维材料的转移、纳米腔的加工良率，还需要进一步优化，才能满足大规模量产的成本要求。

不过，研究团队对此非常乐观：“我们的平台是为大规模量产设计的，通过使用标准制造技术可以加工的材料和结构，我们证明了这些二维材料器件可以集成到大规模的集成光子电路中，这为包含数千个交互光学组件的芯片打开了大门。”LiHe教授表示。

结语

这项飞焦级全光开关的突破，标志着全光计算从实验室的概念，真正走向了实用化的前夜。它不仅为解决AI的能耗危机提供了一个全新的路径，也为未来的光子AI芯片、量子计算芯片打下了核心的技术基础。

随着这项技术的进一步成熟，我们或许很快就能看到，新一代的全光AI芯片，把大模型的能耗降到现在的千分之一，让AI不再是“电老虎”，而是真正走进我们的手机、手表，甚至是更小的边缘设备，开启一个全新的高效AI时代。

参考资料：

ZhiWangetal,StronglyNonlinearNanocavityExcitonPolaritonsinGate-TunableMonolayerSemiconductors,PhysicalReviewLetters(2026).DOI:10.1103/gc15-qsvf.

点击“阅读原文”查看更多