2022年夏天,安大的牛中明和东京大学的梁豪兆发了一篇论文。他们用贝叶斯神经网络预测原子核质量,达到的精度是84 keV——十万分之八十四兆电子伏。这篇发表在《物理评论C》快报上的文章标题很平实,但里面藏着一个门槛:这是第一次,机器学习预测核质量的误差跌破了100 keV。
100 keV是什么概念?标准天体物理模拟中,r过程——产生宇宙中一半以上重元素的核反应链——对核质量的敏感度阈值大约就是这个量级。错一个核的质量超过100 keV,整个丰度曲线的对应区域就可能偏移。牛和梁的84 keV意味着机器学习模型生成的质量数据,第一次可以被r过程模拟当作可靠输入[1]。
这发生在2022年。到2026年,情况完全不同了。
2026年6月初,核物理AI领域最有代表性的两个模型同时出现。一个是Ziyuan Li、Andre Freitas、Stephen Clark和Babette Dellen——两人来自曼彻斯特大学,两人来自Idiap研究所和NIST——开发的AM-PU-GRU[2]。名字绕口,想法直接:把门控循环单元(GRU,一种擅长处理序列的神经网络)改造成能处理复数,并加入乘积单元让它抓得住质量面那些非线性的跳变。结果是把核质量预测误差压到了前所未有的0.227 MeV(插值)和0.179 MeV(外推)。在所有已知来源中,这是序列模型能达到的最好精度。
另一个是Peiwen Zai等人的CoNN——合作神经网络[3]。这篇的激进之处在于输入。大多数AI核质量模型需要"先验"——一个传统理论模型(比如液滴模型或WS4宏观微观模型)先给出一个粗糙估计,AI再微调残差。CoNN不用。它的输入只有两个整数:Z和N。模型自己从四组结构不同的子网中学会液滴趋势、壳效应、两个维度的集体相关性、以及奇偶交错——所有这一切从零开始,不需要任何人告诉它幻数在哪里。
训练结束后的分析让人汗毛竖起。CoNN的一个隐层神经元自发形成了在各个已知幻数(8, 20, 28, 50, 82, 126)上出现极值的激活模式。没有人标注过这些数字。模型自己发现了它们。在包含3558个原子核的AME2020数据集上,CoNN的RMS偏差是0.269 MeV——只比用传统模型做先验的方案大了一点点,但它的输入是零信息的。
这个结果之所以重要,不只是因为精度。它暗示了更深的东西:核素图上那些我们以为需要半个世纪和无数实验才总结出来的模式——液滴趋势、壳层结构、配对关联——其实被编码在核素图的几何结构中。只要给一个足够好的算法,它能自己把它们挖出来。
在裂变物理这个方向,AI的渗透更彻底。
裂变产额——一个重核分裂后产生各种碎片的概率分布——是核能、核废料处理、核法医学和天体物理r过程的核心数据。但它太难测了。一个反应道、一个入射能量、一个靶核——测一遍就需要若干人年的工作量。裂变产额数据库(ENDF、JENDL)中存在大片的空白。
2024年到2026年,东京科学大学的陈境德、向原裕太、藤尾和树、千葉敏、片渕達也、石塚知香子等人——后来部分成员也标注了LANL和中科院的联合身份——发表了"物理嵌入式贝叶斯神经网络"(PE-BNN)框架[4]。这个框架的核心技巧是把我们已知的核物理——壳修正——直接作为输入特征编码进网络,而不是让网络自己去猜。他们在输入里引入了一个"壳因子",用高斯函数在已知的幻数中心(A=134对应Z=50/N=82双幻闭壳,A=140和144对应形变壳)上布峰,再用玻尔兹曼阻尼项让壳效应随激发能平滑消退。这个壳因子单独就让模型的拟合优度提高了21%到35%。
同一年,希腊色萨利大学的Prassa等人发表了贝叶斯混合密度网络[5]——把高斯过程回归、贝叶斯注意力网络和混合密度输出叠在一起,把裂变电荷产额的多峰结构和不确定性同时抓了出来。北大物理学院的团队——核物理与核技术国家重点实验室,和中国核数据中心(中国原子能科学研究院)合作——在2026年初发表了另一条路线[6]:把裂变物理模型GEF的知识作为贝叶斯先验嵌入神经网络,直接预测²³⁵U中子诱发裂变的独立产额和累积产额。这是核物理AI里第一次系统使用"物理模型作为先验"的迁移学习方案。几个月后,Jalili等人在浙理工、南开的联合研究[7]中发表了另一套物理引导的多层感知机方案——用物理约束指导神经网络同时预测质量产额分布和奇偶效应。
还有一个细节值得一提。2025年12月,周梦蝶、乔春源、焦濮、王宏伟等人——来自中科院上海应物所和河南师大——在中国Xiv上发表了对钍同位素链光致裂变产额的贝叶斯评估[8]。预计2026年7月会正式发表在《核科学与技术》上。他们用双层BNN同时捕捉到了不对称裂变到对称裂变的过渡、奇偶效应以及质量分布随能量左移——对钍基熔盐堆的设计有直接意义。
2025-2026年的核反应截面预测领域,AI的推进同样迅猛。
劳伦斯利弗莫尔国家实验室(LLNL)的Hongjun Choi等人发表了一篇将图神经网络应用于截面预测的文章[9],发表在PRC上。这个主意是利用核素图的自然结构——每个核素是图上的一个节点,相邻核素(Z±1, N±1)之间有边。他们先用变分自编码器把每个核素的截面曲线压缩成隐向量,再训练图神经网络从邻居的已知截面推断未知核素的截面。结果不只是预测准确——隐向量的聚类分析自动发现了中子幻数(N=28, 50, 82, 126),核素按中子幻数自然分组。这跟CoNN自己发现幻数一样——核素图的结构中包含了远多于我们明确知道的信息。
截面预测的另一个前沿是HEGM——层次集成生成模型——由Changsong Jin等人在2025年提出[9b]。这个模型把迁移学习、元学习和生成对抗网络(GAN)叠在一起,在¹⁶O和²³⁸U的数据上相对于传统理论代码降低了25%的均方误差。法国CEA的Gesson、Henning、Collin等人发表了DINo算法[9c]——一个用深度学习关联电荷交换截面和总截面的方案,对¹²C靶提高了28%的预测精度。唐彦邦在《知识基系统》上发表了一个用贝叶斯优化+SHAP可解释性分析处理(n,p)反应截面的方案[9d],R²达到0.968,并且用微扰理论的SHAP值验证了模型关注的特征确实是物理上最重要的——入射中子能量和理论先验截面。
在核天体物理这一端,AI正在转化为加速引擎。
最震撼的速度跃升来自M²——Saito、Dillmann、Krücken、Mumpower和Surman在2025年发表的一个前馈神经网络[10]。这个模型以β衰变半衰期和单中子分离能为输入,直接输出最终r过程丰度模式。相对于完整核反应网络,它快了大约两万倍。两万倍。这意味着以前需要在高性能集群上跑几周的模拟,现在可以在几分钟内完成。不确定性量化——通过深度集成方法——也被嵌入了M²,使得天文学家第一次可以系统性地扫描核输入参数对r过程产出的影响。
与此同时,GSI的Just、Xiong和Martínez-Pinedo发布了RHINE[11]——一个用神经网络取代完整核反应网络的Fortran代码,直接嵌入天体物理流体动力学模拟。以前模拟中子星并合时,核反应网络是计算瓶颈,RHINE把这个瓶颈拆了。Jalili、潘峰(辽师大/LSU)、罗延安(南开)和Draayer(LSU)在PRC 111上[12]用支持向量机预测了全核素图的β衰变半衰期,随即把这些半衰期输入r过程模拟,成功再现了太阳系r过程丰度分布。这证明了ML预测的核参数——不是从实验中来,而是从算法中来——已经可以在天体物理模拟中替代实测值,且不破坏结果的一致性。
AI赋能核物理的第一性原理计算——这个方向的名字听起来像是两个时代冲突在一起——也在2024-2026年出现了一系列突破。
最引人注目的是"神经量子态"(Neural Quantum States, NQS)。这个想法是用神经网络直接表示量子多体波函数——不是离散化后存储(那需要指数级的内存),而是用一个连续的、可优化的函数来近似表达。阿贡国家实验室的Alessandro Lovato团队在2024年把NQS用于冷费米气体的BCS-BEC渡越区[13],随后开始攻击⁴⁰Ca和轻超核。2025年7月的一次ECT*专题讨论会上,这个领域的共识是:NQS在核物理格点上仍然极具挑战性,但转移学习(在小核上学到的波函数表征迁移到大核)和簇结构的自发涌现是最有前途的突破口。
2025年,肖志雨等人[14]提出了NNQS-AFQMC——把神经量子态作为辅助场量子蒙特卡罗的试探波函数,在拉伸N₂分子上实现了近精确总能量。同年的《自然-通讯》上,一篇物理信息变压器的文章[15]展示了用类Hartree-Fock参考态加单一变分参数的方案量化偏离独立粒子行为——既有NQS的灵活性,又有物理可解释性。在量子计算一侧,壳模型的量子模拟在2025年出现了几个关键进展:IIT Roorkee和LLNL的Singh、Siwach和Arumugam在PRC 112上[16]发表了格雷码编码的Qubit-ADAPT-VQE方案——通过改变量子比特编码方式显著降低了资源需求,成功在噪声存在下模拟了³⁸Ar和⁶Li。巴塞罗那大学的Carrasco-Codina等人[17]在同年发表了对轻核(⁶He到¹⁰B)的UCC和ADAPT变分量子算法的系统比较,结论是:ADAPT在幻数附近效率高,UCC在中间壳层区域需要资源少。巴黎-萨克雷的Zhang和Lacroix在《物理快报B》上[18]找到一个巧妙的捷径——用ADAPT-VQE收敛路径的中间态做量子子空间对角化,不增加额外电路深度就同时得到基态和激发态。
所有这些铺在一起,一个更大的图景在浮现:AI正在从核物理的"辅助工具"变成"发现引擎"。CoNN自己发现幻数,Choi的GNN自己发现核素分组——这些不是人类把已知规则喂给机器后的复现,而是机器从数据中独立抽出的结构。一个被ML驱动的核物理发现循环——数据→模式识别→预言→实验验证→新数据——正在闭合。
但裂缝也存在,而且不小。
2025年《核安全年鉴》的一篇综述[19]列出了AI在核领域面临的五个核心挑战:数据稀疏且质量参差、泛化到训练集外的能力差、缺乏可解释性、不确定性量化困难、以及——最可怕的——"准确但错误":模型在训练集上表现出色,但学到的是错误的物理原因。如果这样的模型被用于核反应堆安全评估,后果不只是发一篇差论文的问题。
中国原子能科学研究院(CIAE)在2025年9月发表的一篇长篇中文综述[20]把这个问题说得更直白:现有大模型的可解释性不足,在核安全关键场景中部署前需要"大量的准确性、鲁棒性和安全性严格验证"——目前还没有任何一个模型通过这三级验证。
物理学界对这个问题的回应是"物理增强机器学习"(PEML)——不是各做各的物理和AI,而是把物理知识编码进模型架构、损失函数、特征工程和数据增强的每一个环节。PE-BNN的壳因子是这种理念的一个成功案例。混合物理+机器学习在ORNL的临界热流密度预测中取得了比纯ML或纯物理方案都好的结果[21]。这个方向被广泛认同为本领域的出路。
中国在这场变革中的位置值得审视。
牛中明和梁豪兆的2022年BML质量模型[1]是国际核物理AI的里程碑——不仅开了精度先河,而且这个方案被r过程社区广泛采纳。北大物理学院和中国核数据中心的裂变BNN工作[6]代表了"物理先验迁移学习"的新范式。浙理工-南开-辽师大-LSU的Jalili-潘-Draayer团队[7,12]在两个核物理AI前沿(SVM衰变半衰期→r过程验证、物理引导MLP裂变预测)同时产出。中科院上海应物所团队[8]把裂变BNN推进到钍同位素链。清华大学的AI从量子计算、NQS到材料筛选横跨多个方向。近物所的XGBoost超重核α衰变预测[22]和CIAE的CNN核子有效质量劈裂[23]都是"用AI解决一个具体而困难的物理问题"的成功案例。
但两个空白需要正视。其一,中国的核物理AI集中在"应用层"——用现有ML算法解决核物理问题——而对"基础层"(自研ML架构如CoNN、AM-PU-GRU、GNN截面预测器)的贡献偏少。其二,物理增强机器学习(PEML)和AI安全验证(可解释性+鲁棒性+不确定性量化)在中国的核物理AI中还没有系统的、成建制的研究。CIAE的综述指出了这个问题,但需要跟进。
三件事可能在未来三年改变格局。
第一件事是"AI发现新物理"——不是AI帮人类更准更快地算已知的东西,而是AI独立发现人类未识别的物理规则。CoNN自己发现幻数和GNN自己发现核素分组是前奏,真正的目标是一个能扫过整个核素图、挑出"这个区域不符合我们最好的模型"并判断这个偏离确实意味着新物理的系统。
第二件事是多模态融合——把质量、截面、衰变半衰期、裂变产额、反应率这些不同类型的核数据放在一个统一的AI框架里联合学习,用质量数据的精度去约束截面外推,用截面模式去修正质量的奇异点。多任务高斯过程——2026年2月在PRC上展示的同步预测质量和电荷半径[24]——是第一步。
第三件事是NISQ时代的核物理量子计算。ADAPT-VQE和子空间对角化已经把轻核的壳模型模拟推进到了极限——再往前需要用真正的量子硬件而不是模拟器。第一个在物理量子计算机上完成传统壳模型对角化无法处理的计算(维度 > 10¹⁰)的团队,将打开一扇新的门。
五十年前,核物理学家用手算和机械计算器拟合液滴模型参数。三十年前,Fortran程序在壳模型和HFB计算中开始了第一波计算革命。现在,神经网络在发现幻数——而人类并没有告诉它幻数是什么。这不是工具的升级。这是发现的方式在变。
参考文献
[1] Z.M. Niu (牛中明, School of Physics and Optoelectronic Engineering, Anhui University, Hefei, China) and H.Z. Liang (梁豪兆, Department of Physics, University of Tokyo, Japan / RIKEN Nishina Center). "Nuclear mass predictions with machine learning reaching the accuracy required by r-process studies."Physical Review C106, L021303 (2022). RMS精度: 84 keV.
[2] Z. Li (University of Manchester, UK), A. Freitas (University of Manchester / Idiap Research Institute, Switzerland), S. Clark (NIST / Queen Mary University of London, UK), B. Dellen (Idiap Research Institute). "Product units in gated recurrent units improve nuclear-mass prediction." arXiv:2606.06866 (2026). Accepted at ICCS 2026. 插值RMSE: 0.227 MeV, 外推RMSE: 0.179 MeV.
[3] P. Zai, Y. Wang, et al. "Architecture as physical prior: cooperative neural network for nuclear masses." arXiv:2603.09747 (2026). 纯(Z,N)输入, RMSD: 0.269 MeV on AME2020. 自发涌现幻数峰.
[4] J. Chen (陈境德), Y. Mukobara, K. Fujio, S. Chiba (千葉敏), T. Katabuchi (片渕達也), C. Ishizuka (石塚知香子) (Institute of Science Tokyo, Japan; some authors also at LANL/CAS). "A physics-embedded Bayesian neural network for predicting the energy dependence of fission product yields with fine structures."Journal of Nuclear Science and Technology61, 1509–1520 (2024); extended version arXiv:2504.17275v3 (2026, submitted toPhysical Review Letters). Shell factor boosted log-likelihood by 21–35%.
[5] V. Prassa et al. (University of Thessaly, Greece). "Bayesian mixture density networks for evaluating neutron-induced fission charge yields."Physical Review C112, 014607 (2025).
[6] Physics Informed Bayesian Machine Learning of Sparse and Imperfect Nuclear Data. 北京大学物理学院核物理与核技术国家重点实验室 + 中国核数据中心 (CIAE). arXiv:2602.01808 (2026). GEF模型作为BNN先验的迁移学习.
[7] A. Jalili (Zhejiang Sci-Tech University / Nankai University), F. Pan (Liaoning Normal University / Louisiana State University), Y.A. Luo (Nankai University), J.P. Draayer (Louisiana State University). "Multilayer perceptron for fission yield predictions: A physics-guided approach."Physical Review C113, 034605 (2026).
[8] M.-D. Zhou, C.-Y. Qiao, P. Jiao, H.-W. Wang, H.-L. Wei, G.-T. Fan, J.-G. Chen, C.-W. Ma (Shanghai Institute of Applied Physics, CAS / Henan Normal University). "Bayesian evaluation of photofission product yields of Th isotopic chains."Nuclear Science and Techniques37(7), 1 (2026). ChinaXiv:202510.00168 (2025).
[9] H. Choi, S. Mitra, J. Brodksy, R. Glatt, E. Holmbeck, S. Liu, N. Schunck, A. Sieverding, K. Wendt (Lawrence Livermore National Laboratory, USA; S. Mitra at Arizona State University). "Learning nuclear cross sections across the chart of nuclides with graph neural networks."Physical Review C112, 044601 (2025).
[9b] C. Jin et al. "HEGM: Hierarchical Ensemble Generation Model for nuclear reaction cross sections generation."Applied Radiation and Isotopes(2025). Transfer learning + meta-learning + GANs; 25% MSE reduction.
[9c] Gesson, Henning, Collin et al. (CEA, France). "DINo: Deep learning Intelligence for Nuclear reactiOns."European Physical Journal Plus140, 645 (2025). ~28% improvement for ¹²C targets.
[9d] Y. Tang. "Interpretable machine learning for (n,p) reaction cross-sections: A Bayesian-optimized neural network approach."Knowledge-Based Systems(2025). R² = 0.968; SHAP interpretability; MC Dropout UQ.
[10] Saito, Dillmann, Krücken, Mumpower & Surman. "M²: Emulation of the final r-process abundance pattern with a neural network."Journal of Physics G(2025). ~20,000× speed-up; deep ensemble UQ.
[11] Just, Xiong & Martínez-Pinedo (GSI Helmholtz Center, Darmstadt, Germany). "RHINE: R-process Heating Implementation in hydrodynamic simulations with NEural networks." Zenodo:10.5281/ZENODO.15864447 (2025). Fortran code directly integrated into hydro simulations.
[12] A. Jalili, F. Pan, Y.A. Luo, J.P. Draayer. "Nuclear β-decay half-life predictions and r-process nucleosynthesis using machine learning models."Physical Review C111, 034321 (2025). SVM-RBF成功复现太阳系r过程丰度.
[13] J. Kim, B. Fore, A. Lovato (Argonne National Laboratory, USA) et al. "Neural quantum states for cold Fermi gases in the BCS-BEC crossover."Communications Physics7, 148 (2024).
[14] Z.-Y. Xiao et al. "NNQS-AFQMC: Neural network quantum states enhanced fermionic quantum Monte Carlo." arXiv:2507.07540 (2025).
[15] "Physics-informed transformers for electronic quantum states."Nature Communications16, 10811 (2025). HF参考态 + 单一变分参数α + 物理可解释性.
[16] N. Singh, P. Siwach, P. Arumugam (IIT Roorkee, India / Lawrence Livermore National Laboratory, USA). "Advancing quantum simulations of the nuclear shell model with Gray-code-based resource-efficient protocols."Physical Review C112, 034320 (2025). Qubit-ADAPT-VQE + VQD + 零噪声外推 for ³⁸Ar, ⁶Li.
[17] M. Carrasco-Codina, E. Costa, A. Márquez Romero, J. Menéndez, A. Rios (Universitat de Barcelona / Institut de Ciències del Cosmos, Spain). "Comparison of variational quantum eigensolvers in light nuclei."Physical Review C(accepted 2025). UCC vs ADAPT for ⁶He→¹⁰B.
[18] J. Zhang, D. Lacroix (Université Paris-Saclay, CNRS/IN2P3, IJCLab, France). "Excited states from ADAPT-VQE convergence path in many-body problems."Physics Letters B869, 139841 (2025). QSD on intermediate ADAPT states; neutron-proton pairing.
[19] "Physics-enhanced machine learning for probabilistic risk assessment in nuclear safety: An overview, recent developments, and perspectives."Annals of Nuclear Energy(2025). Five core challenges: data scarcity, poor generalization, accurate-but-wrong, uncertainties, non-interpretability.
[20] "Development of Nuclear Science and Technology Empowered by Artificial Intelligence: Status and Prospects of Artificial Intelligence in China Institute of Atomic Energy."Atomic Energy Science and Technology(2025). 中国原子能科学研究院(CIAE).
[21] ORNL. "Physics-based hybrid machine learning for critical heat flux prediction with uncertainty quantification." OSTI:2571909 (2025). 混合物理+ML显著优于纯ML和纯物理方案.
[22] "Machine Learning-Driven High-Precision Model for α-Decay Energy and Half-Life Prediction of Superheavy Nuclei." arXiv:2508.03155v3 (2025–2026). XGBoost + 物理特征工程; 超越Royer公式和UDL.
[23] "使用卷积神经网络分辨核子有效质量劈裂."核动力工程46(2) (2025). 中国原子能科学研究院(CIAE) + 广西师范大学. CNN双通道输入; >99.5%精度 at 50 MeV/u.
[24] "Simultaneous improvements of nuclear mass and charge radius predictions using multitask Gaussian process approaches."Physical Review C(2026). 质量RMSD: 0.136 MeV; 多任务联合学习.
[25] E. Trifinopoulos (MIT). "From Neurons to Neutrons: Interpretable Deep Learning of Nuclear Observables." EINN 2025 Conference. NuCLR模型; 机制可解释性发现Jaffe因式分解和液滴模型.
夜雨聆风