乐于分享
好东西不私藏

全球首个聚变等离子体AI大模型正式开源,可控核聚变商业化加速落地

全球首个聚变等离子体AI大模型正式开源,可控核聚变商业化加速落地

2026年4月23日,IBM Research联合英国原子能管理局UK Atomic Energy Authority(UKAEA)、STFC Hartree Centre,正式发布并开源了全球首个聚变等离子体AI大模型TokaMind,同时配套开源了面向等离子体分析任务的基准测试套件TokaMark。目前,两款工具均已上线GitHub,面向全球科研工作者开放下载。
TokaMind:  https://github.com/UKAEA-IBM-STFC-Fusion-FMs/tokamind/tree/main
想要在地球上实现可控核聚变,需要在tokamak(托卡马克)的磁约束装置中,将氢同位素加热到超过太阳核心的温度,使其聚变形成等离子体。科研人员必须让等离子体保持足够的温度与密度,确保聚变反应释放的能量超过输入能量——也就是核聚变领域的“圣杯”break even(能量收支平衡);同时还要维持等离子体的稳定性,避免其失控损毁装置。
目前全球有超过50台托卡马克装置正在运行,核心目标都是推动可控核聚变商业化,最终向电网输送净聚变能。UKAEA正是该领域的核心参与者之一,此次与IBM Research、STFC Hartree Centre的合作,正是通过前沿AI算法,将托卡马克装置产生的原始数据转化为可落地的科研成果,解锁关于等离子体行为的全新认知。
一、TokaMind:重新定义聚变等离子体的建模方式
此次开源的TokaMind,是全球首个专为聚变等离子体打造的AI大模型。它将UKAEA旗下Mega Ampere Spherical Tokamak(MAST)装置中,不同频率、不同时间尺度的传感器数据进行融合处理,最终形成了一套结构化、统一化的表征体系,精准刻画等离子体对托卡马克各类运行参数的响应规律。
“去年,我们与UKAEA、STFC开启了这项合作,探索最前沿的基础AI技术如何为聚变等离子体建模及相关应用提供支撑。”IBM Research欧洲区(爱尔兰与英国)总监Juan Bernabé-Moreno表示,“仅仅两年时间,我们不仅发布了全球首个面向托卡马克装置的AI大模型,更为核聚变领域的算法研究设立了全新标准。”
核心训练与能力突破
科研团队基于1999年至2013年MAST装置的全量实验数据完成了TokaMind的训练,这些实验数据早已验证了这种紧凑型球形托卡马克(外形更接近带核苹果,而非传统托卡马克的甜甜圈造型)具备成为聚变电站核心装置的潜力。而TokaMind带来的全新科研洞察,将直接助力UKAEA优化Spherical Tokamak for Energy Production(STEP)原型聚变电站的设计,并指导其投运后的初始运行工作——该电站预计将于2040年代正式投用。
在Transformer架构的AI模型出现之前,科研人员始终没有有效方法,全面拆解MAST装置传感器输出的海量、多维度数据。此前核聚变领域的科研突破,大多都来自于科研人员筛选出的一小部分高价值数据。
“科研工作者总会下意识去关注最亮眼、性能最优的等离子体数据。”UKAEA计算项目总监Rob Akers表示,“但我认为,那些看起来平平无奇的实验脉冲数据里,可能藏着同等重要的信息。如今我们能够基于全量数据构建模型,我相信我们会挖掘出极具价值的全新认知,而AI将让我们得以基于全部数据做出决策。”
与IBM此前联合NASA、欧洲空间局打造的AI模型(用于整合处理海量地理空间、太阳活动与气候数据)一脉相承,TokaMind成功将MAST装置的原始数据转化为可迁移的知识,能够适配各类等离子体分析任务。
性能验证:TokaMark基准测试全面领先
为了全面验证模型能力,研究团队同步设计并开源了专属基准测试套件TokaMark。测试结果显示,在14项等离子体分析任务中,TokaMind在几乎所有任务上的表现,都优于为单任务独立训练的传统机器学习模型。
预训练环节为模型带来了核心的能力跃升。与同类大模型一致,研究团队在训练中向TokaMind输入了部分被掩码的数据,要求模型完成内容重构。而在“补全空白”的学习过程中,模型掌握的核心知识,使其在高难度任务中展现出了显著优势。
尤其在长期预测任务中,TokaMind相比基线模型的优势最为突出。
“预训练过程切实帮助模型掌握了可迁移的等离子体动力学表征能力。”参与模型训练的IBM研究员Tobia Boschi表示,“我们的目标是用一个模型,通过轻量化微调完成所有任务,而我们最终实现了这个目标。”
掩码预训练同时还优化了MAST数据集的整体质量。在托卡马克实验中,单次实验脉冲就会有数百个传感器同步采集数据,传感器偶发故障是常见情况。
“我们不会因为一个传感器故障就舍弃整组实验数据。”IBM工程团队负责人Alessandra Pascale表示,“而这个模型能够有效帮助我们修复、挽救这些数据。”
从参数量来看,TokaMind仅有900万参数,在生成式模型中属于轻量化设计,但其训练数据的复杂度却鲜有匹敌。模型融合并编码了约40种不同频率的信号数据,涵盖等离子体的物理特性描述、装置本体与磁体系统的诊断数据等多个维度。
二、从单装置到全行业:TokaMind的未来规划
目前TokaMind仅完成了单台托卡马克装置的数据训练与适配,而UKAEA的科研团队计划向模型中纳入更多其他托卡马克装置的实验数据。这不仅能让科研人员对比不同实验结果,筛选出最具潜力的装置设计方案,还能将经过仿真验证的等离子体行为数学描述融入模型,探索优化聚变性能、提升控制能力的全新路径。
“我们有望通过新的执行器优化现有实验,对等离子体进行精准调控,提升其性能,推动其进入全新的运行区间。”Rob Akers表示,“如果我们能将实验数据,与我们对等离子体的理论和模型化认知结合起来,这将带来颠覆性的变革。”
在项目的下一阶段,研究团队将把MAST Upgrade(MAST-U)装置的数据纳入TokaMind的训练体系,未来还可能拓展至全球其他托卡马克装置。随着训练数据的不断丰富,模型将能够揭示装置设计与其他关键变量对等离子体状态的影响规律,为优化装置几何结构与运行方案提供全新抓手。
同时,研究团队还计划将物理仿真数据融入TokaMind,实现实验实测数据与物理仿真数据的双向互补,而UKAEA即将上线的AI超算Sunrise——未来全球算力最强的聚变能源专用超算,将为项目的持续推进提供核心算力支撑。
三、AI+量子+超算:聚变商业化的终极技术拼图
可控核聚变的落地,需要人类整合手中最顶尖的技术工具。在核聚变科研领域,这既包括能够处理海量实验数据的前沿算法,也包括基于偏微分方程(PDEs)构建的数学模型——后者能够仿真托卡马克装置与内部等离子体之间的复杂相互作用。研究团队预计,想要完整运行这些模型,安全实现向商业聚变的最终跨越,还需要经典超算与量子计算的深度协同。
如今,大模型为科研人员提供了融合实测实验数据与物理仿真数据的全新可能。
“我们现在能够构建替代式AI模型来表征这些复杂系统。”Rob Akers表示,“它们的精度或许不及全尺寸的高保真仿真,但能够让我们探索更多的设计空间选项,识别预测过程中的不确定性。而通过将AI替代模型与高保真仿真相结合,我们能够全面提升预测质量,规避发生概率极低、但潜在影响灾难性的‘黑天鹅’事件。”
研究团队为TokaMind选定的首个物理方程融合目标,是描述托卡马克等离子体平衡态的Grad-Shafranov力平衡方程——该方程刻画了等离子体的向外压力与约束磁场的向内力之间的平衡关系,是理解等离子体形状与位置的核心方程。将其与其他专业理论知识结合后,模型对等离子体状态的理解将实现质的飞跃,预测能力也将同步提升。
“TokaMind将为整个行业带来巨大的价值,但在一些复杂场景中,仅靠统计学习仍存在局限。”Juan Bernabé-Moreno表示,“我们需要新一代算法,一套能够以全新底层逻辑表征信息的算法。”
等离子体的行为由原子级相互作用、多尺度湍流与高度非线性动力学共同决定。TokaMind这类数据驱动模型,能够从仿真数据中提取规律,但也会继承数据本身的局限性。当底层物理规律过于复杂,无法通过经典计算完成仿真时,模型的精度就会进入瓶颈。
而量子计算能够通过希尔伯特空间中的波函数,原生表征原子、电子、光子等量子力学系统。对于等离子体研究而言,量子算法能够更精准地在本征尺度上仿真动力学与多体效应,生成更高保真度的训练数据,助力AI替代模型通过求解偏微分方程、采样复杂分布,攻克更多核心难题。
“核聚变领域的计算挑战,只有通过量子计算、AI与高性能计算(HPC)的深度融合才能解决。”IBM院士、IBM Research算法与应用副总裁Alessandro Curioni表示,“量子能够处理经典计算无法覆盖的物理规律,AI能够输出快速、可靠的结果,而HPC则是实现这些互补方法规模化、一体化运行的算力基石。三者结合,将共同推动等离子体建模领域的边界持续突破。”
“在实现模型的规模化落地、直接服务于实验之前,我们仍有大量的核心工作要完成。”Rob Akers表示,“但过去一年我们取得了里程碑式的进展,与IBM、Hartree Centre的合作,正推动我们持续聚焦,全力实现核聚变领域属于人类的‘登月时刻’。”

(可控核聚变产业技术群)
欢迎投资人、科技科研人员、行业政策调研人员、研究生加入,群总体规模已有~1000人