乐于分享
好东西不私藏

深耕高速互联全链路突破,协同打造AI Infra开放标准|2026 OAII Summit高速互联主题论坛圆满落幕

深耕高速互联全链路突破,协同打造AI Infra开放标准|2026 OAII Summit高速互联主题论坛圆满落幕

随着AI大模型持续迭代、智算集群规模不断扩大,算力密度飞速提升,高速互联已成为制约AI超节点性能释放、决定智算系统整体效率的核心关键。

面对224G/448G速率升级、铜光融合演进、协议统一、大规模组网等行业全新挑战,高速互联主题论坛作为2026 Open AI Infra Summit主论坛之外六大核心主题论坛之一,由 GCC-Open AI Infra 社区 AI 整机柜项目群高速互连项目组联合承办百度智能云资深系统工程师武正辉、华为光互连技术专家孙晓斌共同担任论坛主席。

本次论坛邀请到OAII社区顾问委员会委员雷葆华老师主持本场论坛

论坛立足产业真实痛点与技术发展趋势,聚焦超低延迟互连、电互连、光互连核心领域新方向,围绕光-电-协议多维度展开深度分享,探讨高速互联的行业应用领域,相关形态的变化,覆盖从技术规划到落地实践、从硬件创新到瓶颈破解的全维度内容,破解多节点协同传输瓶颈和协议,解锁高互联带宽新可能,为 AI 超节点高速互联技术发展提供多维度参考,助力智算系统高效互联。

百度智能云 武正辉

《算力为基 互联为翼 重构 AI Infra》

只有算力不足以支撑大模型的需求,互联也非常重要。通过互联连接GPU,数据才能够腾飞,实现高效的AI推理和训练环境。

武正辉认为大模型应用需要Scale Up网络解决“计算、网络、存储”这三堵墙,这就是超节点诞生的背景。他在分享中,详细介绍了百度天池超节点的架构创新设计,包括资源池化、大异构融合、高速互联、能效优化系统以及硬件资源解耦。在未来迈向256乃至512卡全互联的超节点过程中,百度天池超节点对高速互联提出的越来越多的要求,以及相对应的解决方案。武正辉强调,百度天池超节点正是为推理大模型而生,可以加持推理大模型快速迭代。

华为灵衢协议专家 张亚丽 

《灵衢互联协议介绍及灵衢超节点系统应用》

高速互联技术是破解当前超节点发展瓶颈的核心支撑,华为灵衢协议(UB)以全对等架构、自研协议栈为核心,构建高带宽、低时延、高可靠的高速互联体系,适配超节点异构算力整合与大规模组网需求,打通算力调度与数据传输堵点,成为超节点架构落地及场景应用的关键技术底座。

张亚丽认为当前大模型迭代与通算、智算场景拓展,使单芯片算力不足、单纯算力堆叠导致的资源浪费、跨节点通信低效等问题日益突出,高速互联能力不足成为制约超节点效能发挥的关键瓶颈。为此,华为灵衢协议依托全对等设计实现节点间无协议转换,自研协议栈从物理层到应用层持续优化,有效提升算力利用率,破解数据无效搬运、RPC 通信低效等痛点。

Molex 系统架构总监贾功贤 

《AI超节点电互联架构趋势分析》

超节点高速互联技术正向高速率、高密度演进,当前面临 PCB 孔损耗、信号 skew、线缆管理、连接器可靠性等核心挑战,铜互联与光互联的应用需结合场景适配,编码方案与架构设计仍处于产业探索阶段,需全产业链协同突破。

贾功贤认为随着超节点向 128 卡、256 卡规模化发展,高速互联速率向 224、448 演进,PCB 孔损耗、信号延时差异等问题凸显,线缆管理与连接器设计成为制约效能的关键。当前铜互联多用于柜内短距场景,长距场景逐步向光互联过渡,编码方案暂未统一,PAM4 与 PAM6 的应用需结合带宽需求适配。同时,超节点拓扑设计、可维护性优化等仍在探索,Open19 规范可为可插拔高密度光互连scale up方案提供借鉴。

阿里云高速互联架构师 邱宇弟

《破局 Scale Up 未来发展瓶颈:UALink 2.0 协议演进与分析》

大模型参数量激增推动 Scale Up 高速互联需求,UALink 作为开放行业标准协议,以轻量化协议栈实现低时延、高带宽,2.0 版本通过发布 4 项新规范,新增在网计算、链路弹性等核心功能,拆分 DL-PL 规范实现独立演进,依托多厂商共建生态,成为超节点高速互联的重要开放支撑。

邱宇弟认为大模型发展使单卡算力难以满足需求,Scale Up 高速互联成为刚需,UALink 协议顺势推出。其作为 PCIe、CXL 与以太的补充,主打轻量化设计,带宽效率可达 93%以上。

安费诺通信方案技术总监 吴国继

《AI 时代铜基互联的未来探讨》

AI大模型集群化发展推动高速互联技术迭代,224G 阶段铜缆是 Scale Up 场景主流方案,448G 阶段面临调制方式、传输损耗等核心挑战,未来高速互联将呈现铜缆与光互联融合共生格局,而非非此即彼的选择。

吴国继认为AI大模型集群规模扩大,算力增长受互联技术制约,高速互联需求持续升级。224G 阶段,铜缆因低损耗优势成为柜内 Scale Up 场景主流,光互联则主导 Scale Out 场景。随着速率向 448G 演进,PAM4 调制等技术难度激增,PCB 损耗问题突出,铜缆与光互联各有挑战。

庆虹电子 FAE 总监 陈宣豪

《 超节点 224G 高速互联系统方案实践与思考》

超节点硬件方案百花齐放,高速互联技术核心聚焦工程化落地与硬件适配,224G 阶段线缆化成为破解 PCB 损耗的关键路径,厂商通过优化线材与连接器设计平衡高密化与低损耗需求;448G 阶段损耗标准、调制方式(PAM4/PAM6)尚未形成行业共识,行业需依托开放共创、技术迭代,强化量产与质量管控,推动高速互联硬件适配超节点多样化场景。

陈宣豪认为高速互联硬件的适配性与工程化落地是行业关键。PCB 损耗制约高速传输,线缆化逐步替代 PCB 成为主流,庆虹电子推出方舟系列方案,适配 224G 场景并向 448G 演进,通过优化连接器密度与线材选型,实现低损耗传输。由于 448G 相关标准尚未统一,且高密化与低损耗存在天然矛盾,行业需加强联动共创,攻坚变线径连接、多工艺焊接等技术难点,同时强化质量管控与自动化量产能力,才能推动高速互联硬件有效适配超节点各类场景,保障 AI 超节点稳定落地。

华为光互连技术专家 孙晓斌

《短距光互联技术驱动力与发展策略》

算力密度提升与功耗散热瓶颈,推动光互联成为超节点互联主战场;CPO 与 NPO 并非替代关系,而是场景化选择,接口互通与生态标准化是降低成本、提升运维效率的关键,224G NPO链路预算需精细化管控,国内未来将重点推进 NPO路线,同时亟需完善测试标准与生态协同。

孙晓斌认为着超节点算力呈数十倍增长,互联带宽增速滞后形成“通信墙”,传统铜缆与 PCB 在高速场景下传输距离受限,且难以适配液冷机柜运维需求,光互联成为必然选择。华为、英伟达等企业已推出光互联超节点方案,CPO 主打极致性能与功耗,NPO 侧重生态解耦与可维护性。OFC 2026 发布三大 MSA 规范,推动光互联接口互通,但224G NPO链路预算需精细管控电光电插损,现有测试指标已不适用。当前行业仍缺失适配 NPO/CPO 的测试设备与方法,国内需加快统一 NPO 接口标准,通过研发攻坚与生态联动,推动超节点光互联技术规模化落地。

中科曙光解决方案架构师 罗宾

《高速互联在 AI 超节点中的架构设计与实践》

算力进入“网络决胜期”,RDMA技术是AI与HPC领域高速互联核心支撑,海外厂商垄断带来诸多痛点,中科曙光推出 scaleFabric400高速网络与 scaleX40 超节点,实现国际对标,填补国产空白,推动国产高速互联规模化落地。

罗宾认为AI大模型训练通信开销激增,单节点算力难满足大规模需求,计算范式向高密度AI超节点演进,高速互联成为系统性能关键。RDMA技术因无损传输、低延时优势成为核心支撑,但国内高速网络长期依赖海外,存在成本高、供应不稳等问题。中科曙光自主研发的scaleFabric400 系列对标国际顶尖水平,端到端时延低于1微秒,已实现10万卡级集群部署,大幅降低成本,为AI与超算领域提供自主可控解决方案。

立讯技术资深系统架构师 李承伟

《224G互连解决方案&448G互连方案探索》

高速互联的核心是解决互联互通问题,“光进铜退”并非行业趋势,铜互联在节点内、机柜内及相邻柜间,凭借成本、可靠性优势仍有广阔空间;立讯技术聚焦 224G/448G铜互联方案,通过CPC技术优化、全链路解决方案,推动铜互联传输距离与带宽提升,助力产业在现有生态下实现448G PAM4落地。

李承伟认为当前高速互联多标准并行,行业需平衡成本、可靠性与算力部署需求,铜互联的价值被重新重视。相较于光互联,铜互联可实现不停机维护,大幅降低运维成本,推动448G带宽延伸,同时布局背板连接器升级,为 224G/448G 高速互联落地提供可靠支撑,助力产业实现高效、经济的互联互通。

华工正源副总经理、CTO 罗传能

《CPO/NPO/XPO 多元路径:重构AI智算中心的下一代光连接技术》

AI大模型“大参数、大数据、大算力”需求推动智算光互联快速发展,单卡算力接近极限,光连接成为释放算力的关键;CPO、NPO、XPO构成多元技术路径,无替代关系,适配不同场景,行业正加速技术迭代与标准化,华工正源聚焦光引擎光模块研发,推动单波400G、3.2T NPO等技术落地,助力重构AI智算中心下一代光连接体系。

罗传能认为AI智算需求激增带动光连接市场扩容,其市场规模未来将向千亿美金迈进,但单卡算力瓶颈凸显,光连接的重要性愈发突出。当前光互联形成可插拔与共封装/近封装两大板块,CPO主打极致性能,NPO兼顾产业链开放与低功耗特点,XPO 依托液冷散热技术突破可插拔封装瓶颈,三大路径并行发展。

万里眼北京分公司总经理 技术专家 宗仙丽

《 “高带宽+低时延+无损传输” 下的网算存一体高速互联测试场景》

宗仙丽认为AI驱动下,高速互联正朝着高带宽、低时延、无损传输方向演进,SerDes、光模块速率持续升级,而完善的测试体系是高速互联稳定落地、质量可控的核心保障;SerDes 均衡参数激增导致传统测试效率低下、精度不足。为此,万里眼构建物理与数字两大测试平台,发布 90G 带宽实时示波器,可完整覆盖 112G、224G SerDes 协议一致性测试,其智能参数寻优算法将测试时间从两周缩短至 10 分钟,从而破解高速互联测试瓶颈。

整体而言,本场论坛贯通电互联、光互联、互联协议、硬件方案、工程落地、测试验证全产业链链路,系统梳理224G 向 448G 演进、铜光融合共生、开放标准统一、国产自主可控四大核心行业趋势。论坛以开放共创、协同攻坚的社区理念破解超节点互联核心瓶颈,凝聚产业链共识、沉淀实践经验,为下一代 AI 智算基础设施互联架构升级、规模化落地建设提供权威、全面、可落地的实践指引与方向参考。