光计算AI硬件:光子芯片的算力突破与产业化进展
当摩尔定律走到尽头,电子芯片的性能提升,越来越慢,功耗越来越高,AI算力的需求,却在指数级的增长。在这一背景下,光计算,作为一种全新的计算范式,成为了行业的热点。它用光子,替代电子,作为信息的载体,利用光的高速、低耗、并行的特性,突破电子芯片的物理极限,为AI算力,带来了指数级的提升,成为了后摩尔时代,AI硬件的新方向。
一、光计算的核心优势:光子的天然特性 光子,相比电子,有三个天然的优势,完美适配AI的算力需求:
首先,速度极致的快。光速,是宇宙中最快的速度,3×10^8 m/s,而电子在硅中的迁移速度,只有10^5 m/s,差了三个数量级。光信号的传输延迟,是纳秒级的,比电子低了100倍,这意味着,AI的计算延迟,可以从毫秒级,降到微秒级,完美适配实时的AI任务。
其次,功耗极低。光信号在波导中传输,损耗只有0.1dB/km,而电子在铜线中传输,损耗是1-10dB/m,差了三个数量级。这就意味着,光计算的能耗,只有电子计算的1%,数据搬运的能耗,几乎可以忽略,彻底解决了AI数据中心的散热和功耗问题。
最后,天然的并行性。光信号,可以通过波长、偏振、相位,进行复用,单条光路,可以同时传输多路信号,互相不干扰,天然的并行,完美适配AI的大规模并行计算需求。比如,一个128×128的光矩阵,就可以同时完成16384次的乘加运算,这是电子芯片无法比拟的。
这三个优势,让光计算,成为了突破AI算力瓶颈的终极方案,理论上,光计算的算力,可以比电子芯片,高1000倍,能效,高100倍,这正是大模型时代,我们最需要的。
二、核心技术路线:从光电混合到全光计算 光计算的技术路线,正在从光电混合,走向全光计算,逐步的成熟落地。
### 1. 光电混合计算:当前的商用主流 光电混合计算,是把光计算和电子计算结合在一起,光芯片负责线性的矩阵运算,电子芯片负责非线性的激活、控制,两者协同,兼顾性能和兼容性。这是当前最容易落地的路线,也是目前商用产品的主流。
比如,曦智科技的天枢计算卡,就是这一路线的代表。它的核心,是128×128的光学矩阵,光芯片负责矩阵乘法,电子芯片负责控制和非线性处理,两者通过3D封装集成在一起。整个卡的功耗,只有50W,算力达到了1000 TOPS,能效比,是GPU的10倍。它支持Llama、ResNet等主流的AI模型,已经可以部署在现有的服务器中,不需要改造,完美适配现有的软件生态。
光本位科技的第一代光电融合计算卡,也是这一路线,它已经拿到了国内大模型公司的订单,部署在金融的垂类大模型上,这是全球首个光计算卡在大模型场景的落地,标志着光计算,从实验室,走向了商业化。
### 2. 全光计算:终极的技术方向 全光计算,是所有的计算,都在光域完成,不需要光电的转换,彻底发挥光子的优势,这是光计算的终极方向。
上交大的LightGen芯片,就是全光计算的代表,它在《Science》杂志上发表的成果,震惊了全球。它集成了210万个光子神经元,在35mm²的芯片上,实现了全光的端到端计算,所有的过程,都在光域完成,不需要光电转换。它的算力,达到了3.57×10^12 TOPS,能效比,达到了10^6 TOPS/W,比A100,高了两个数量级。它可以流畅的完成512x512的图像生成,NeRF的视频生成,性能和Stable Diffusion相当,但速度,快了100倍,功耗,只有1%。
而且,LightGen芯片,采用了薄膜铌酸锂的工艺,用国内的DUV光刻机,就可以量产,不需要EUV,完美的绕开了制程的封锁,实现了自主可控。国内的薄膜铌酸锂产业链,已经非常成熟,6英寸的晶圆,良率超过90%,为LightGen的产业化,奠定了基础。
还有华中科技大学的LAMP芯片,更是创新的用玻璃,作为衬底,用飞秒激光,在玻璃内部,刻出三维的光路网络,实现了三维的光计算。它的理论算力,达到了6554 TOPS,功耗几乎为零,因为玻璃的传输,几乎没有损耗。这种技术,不需要复杂的制程,国产的玻璃和激光设备,就可以做,彻底打破了高端芯片的制程封锁。
三、产业化的突破:从实验室到商用 光计算,已经经历了几十年的研究,现在,终于走到了产业化的临界点,2025-2026年,成为了光计算的商业化元年。
首先,产品的落地。光本位科技,在2024年,就推出了全球首颗商用的光计算芯片,峰值算力,突破了1000 TOPS,2025年,它的光电计算卡,已经拿到了大模型公司的订单,开始商用。曦智科技的天枢卡,也在2026年,正式量产,支持Llama大模型的推理,已经有很多客户,开始测试部署。
然后,产业链的成熟。国内的光子产业链,已经完整的建立起来了,从材料、设计、制造、封测,都实现了自主可控。长三角的张江,已经聚集了超过200家的光子芯片公司,形成了完整的产业链,流片的周期,从半年,压缩到了两周,研发的迭代速度,提升了数十倍。
资本的涌入,也加速了产业的发展。2026年上半年,光计算赛道的融资,超过了120亿元,光本位、曦智,都拿到了大额的融资,沙特的工业部长,都主动找上门,想要合作,因为光计算,解决了他们算力的需求。
应用的场景,也在快速的拓展。光计算,首先在推理场景落地,因为推理的需求,对能效和延迟,要求最高。比如,金融的高频交易,自动驾驶的实时感知,医疗影像的分析,这些场景,光计算的优势,非常明显。比如,PhotonCore-1光子芯片,在自动驾驶的场景,1.2毫秒,就完成了全链路的处理,比传统的方案,快了17倍,已经通过了ASIL-D的安全认证,年底就要量产装车。
四、核心的工程难点:光计算的挑战 虽然光计算的前景很好,但它仍然面临很多的工程难点,需要突破:
首先,集成的规模。传统的光芯片,集成的神经元,只有几千个,无法支撑大模型的需求。现在,LightGen已经做到了210万个,未来,我们需要做到上亿个,这对工艺的精度,提出了极高的要求。
其次,非线性的处理。光的线性运算,很容易做,但非线性的激活函数,很难在光域做,所以,早期的光芯片,只能做简单的分类,无法做复杂的生成式AI。现在,上交大的团队,已经解决了这个问题,实现了全光的非线性处理,让光芯片,可以做复杂的生成式任务。
然后,软件的生态。光计算的架构,和传统的电子芯片,完全不同,所以,需要新的编译器,新的编程框架,把现有的AI模型,自动的映射到光芯片上,不需要开发者重新开发。现在,尊时凯龙的PhotonMLIR编译器,已经实现了这一点,支持PyTorch、TensorFlow的自动适配,开发者不需要懂光计算,就可以用,这就降低了使用的门槛。
还有,信号的噪声。光的信号,很容易受到温度、振动的影响,导致误差。现在,行业通过自适应的相位补偿技术,实时的调整,把误码率,控制在了10^-15以下,达到了工业级的可靠性,解决了这个问题。
五、未来的展望:光算时代的黎明 光计算的未来,非常的广阔,我们已经看到了清晰的路线图:
短期,2026-2027年,光电混合的计算卡,会大规模的商用,在推理场景,替代部分的GPU,降低推理的成本和功耗,解决HBM的供需矛盾。
中期,2028-2030年,全光的芯片,会逐步成熟,开始进入训练的场景,万亿参数的大模型训练,用全光芯片,周期可以从几个月,缩短到几天,功耗,降低90%。
长期,光计算会和3D堆叠、Chiplet技术融合,构建异构的系统,把光的计算单元,和电子的控制单元,集成在一起,实现极致的性能。甚至,我们会看到光计算的卫星,把算力搬到太空,因为光计算的抗辐照能力强,功耗低,完美适配太空的环境,光本位的光计算卫星,已经启动研制了,未来,天上的算力网络,会成为现实。
光计算,不是要彻底的替代电子计算,而是互补,电子计算,负责复杂的控制和逻辑,光计算,负责大规模的并行矩阵运算,两者结合,把AI的算力,推向新的高度。
从电子到光子,这是计算范式的革命,它突破了摩尔定律的极限,突破了冯诺依曼的瓶颈,为AI的下一个十年,提供了无限的可能。光算时代的黎明,已经到来了。

夜雨聆风