乐于分享
好东西不私藏

AI与物理融合:走向云雨区同化全可微建模——PhySCAT-Net:从卫星观测中学习冰晶散射参数化

AI与物理融合:走向云雨区同化全可微建模——PhySCAT-Net:从卫星观测中学习冰晶散射参数化

AI与物理融合:走向云雨区同化全可微建模——PhySCAT-Net:从卫星观测中学习冰晶散射参数化

背景与挑战

辐射传输模式是卫星遥感反演、仪器定标监测和资料同化的核心工具,其精度直接决定了从卫星观测中提取大气信息的能力。在晴空条件下辐射传输计算相对成熟,而在云雨条件下,微波辐射与水凝物粒子之间存在复杂的吸收和散射作用,辐射传输计算的不确定性显著增大。高频微波湿度探测通道由于波长较短,对冰晶、雪等冰相水凝物的散射效应尤为敏感。受云微物理过程复杂性和观测约束不足的影响,当前辐射传输模式中水凝物体散射性质(Bulk Scattering Properties,BSPs)的参数化仍存在较大不确定性,由此引发的模拟偏差严重制约了云雨区卫星资料的有效利用。

围绕BSPs参数化的优化,国内外学者已开展大量工作。现有研究多通过极小化观测与模拟之间的统计差异,在有限的粒子形状数据库(如Liu (2008)、ARTS散射数据库)中筛选“全局最优”的单一粒子形状。这类方法虽在一定程度上改善了模拟精度,但本质上受限于两个根本假设:一是将全球复杂多变的冰相粒子形态简化为“单一形状全球适用”(one-shape-fits-all)的固定模型;二是参数搜索空间局限于预定义的离散方案集合,即使遍历数据库中所有候选形状,也难以真正触及观测所约束的最优解。

冰相粒子的真实形态受温度、湿度、垂直速度等多种气象条件共同调控,其散射特性本质上是一个连续、高维的函数分布。如何突破“离散穷举”的思维定式,构建一个既能刻画冰晶形态自然变异、又能在连续高维参数空间中自动寻优、自动学习的建模框架,成为云雨区微波辐射传输模拟亟待突破的前沿课题。

研究创新:PhySCAT-Net 物理约束深度

学习框架

(1)物理模式与神经网络的可微分耦合

传统快速辐射传输模式(如RTTOV、CRTM、ARMS等)多基于Fortran语言开发,运行于深度学习框架之外,其梯度信息无法回传至神经网络,这也是制约“AI+物理模式”融合的关键瓶颈之一。本研究将物理辐射传输模式的正向算子与雅可比算子直接嵌入PyTorch训练流程(图1),构建了从卫星观测亮温到神经网络参数的完整可微分路径,支持基于梯度的反向传播优化。

图1 PhySCAT-Net物理约束深度学习框架概览,用于水凝物体散射性质的参数化与优化

(2)面向云区优化问题的关键设计

云降水预报中,逐点评估指标存在“双重惩罚”问题:当模拟的云雨位置与观测略有偏差时,模型同时承受“漏报”和“空报”两次惩罚,导致优化过程倾向于削弱云雨特征以降低误差。研究采用基于Jensen-Shannon散度的地理分区损失函数,从概率分布层面比较模拟与观测亮温的统计特征,有效规避了这一问题。

试验验证

研究以GPM卫星GMI 166.5 GHz双极化观测为约束,以ERA5再分析资料为输入,在全球海洋区域(50°S–50°N)开展验证。

(1)亮温模拟精度大幅提升

经神经网络优化后,O-B平均偏差由−0.87 K(V 极化)和−0.85 K(H 极化)大幅降低至约−0.2 K,偏度由−6.95 和−6.09改善至−2.96和−2.53(图2)

图2 GMI 166.5 GHz(a)垂直极化和(b)水平极化通道O-B的概率密度函数

以2023年台风“杜苏芮”为例(图3),控制试验因系统性低估散射强度,眼墙区亮温整体偏暖。神经网络通过增强雪粒子散射,成功再现了眼墙区的低亮温特征。

图3 2023年7月24日台风“杜苏芮”期间GMI 166.5 GHz垂直极化亮温示例,展示了(a)观测值,(b)ERA5雪水路径,(c)Control模拟,(d)NN-optimized模拟

(2)非球形粒子偏振信号的成功再现

非球形粒子在重力与空气动力的作用下常呈现出取向偏好,使垂直极化与水平极化的散射特性产生差异,由此形成极化差(PD)。观测表明极化差与亮温之间存在独特的“拱形”非单调关系(图4b)。现有基于固定极化比的经验方案只能再现极化差随亮温单调递增的趋势(图4c),无法刻画冷端下降。PhySCAT-Net直接从观测中学习非球形冰粒的极化特征,成功再现了极化差和亮温的拱形结构(图4d)。

图4 166.5 GHz 极化差(PD)模拟性能评估。(a) 不同方案的PD直方图。(b-d) PD与V极化亮温的二维联合分布,分别对应观测、Control(含极化订正)和 NN-optimized。颜色表示对数密度。

未来展望

(1)多频率联合约束。当前研究仅使用166.5 GHz单一频率优化雪粒子BSPs。未来可引入18-50 GHz低频通道约束液态水凝物的光学性质,并结合即将发射的冰云成像仪(ICI)亚毫米波通道对云冰粒子进行精细优化。

(2)跨轨扫描仪器适配。针对跨轨扫描式微波探测仪观测几何角度变化的特点,未来可将卫星天顶角作为输入变量,使网络能够学习光学特性与偏振度对观测几何的依赖关系。

(3)嵌入业务同化系统。神经网络固有的可微分特性使其天然适配变分同化框架。下一步工作将把PhySCAT-Net嵌入中国气象局全球预报系统(CMA-GFS)开展循环同化试验,评估优化BSPs对全球分析与预报精度的影响。

研究心得

回顾整个研究过程,有两个关键节点对我们影响很深。

  • 第一个节点,是打通那条梯度路。最初,神经网络的输出只是为辐射传输模式提供散射参数,而Fortran编写的RTTOV本身像个黑箱,梯度无法回传至神经网络。我们尝试过强化学习、贝叶斯优化等替代方案,效果都不理想。直到我们决定借助F2py,把RTTOV的正向算子与雅可比算子”搬”进PyTorch。具体做法不是重写,而是将Fortran子程序封装为Python可调用接口,再接入PyTorch计算图,手工补齐前向与反向传播链路。代码跑通的那一刻,我们意识到,物理模式不再是神经网络的”外挂”,而是其可微分的一部分。AI与物理的融合,由此从”并联”走向”串联”。

  • 第二个节点,是放弃MSE损失。一开始我们沿用逐点均方误差作为优化目标,结果模型总是倾向于”平滑”掉云雨特征。当模拟与观测的云雨位置略有偏差时,逐点指标会同时计入”漏报”与”空报”两次惩罚,模型为降低损失会主动削弱散射信号强度。改用基于Jensen-Shannon散度的地理分区损失之后,从概率分布层面比较模拟与观测,台风眼墙的低亮温特征、极化差的拱形结构,那些原本被”磨平”的真实物理信号才逐渐显现出来。这让我们体会到,损失函数的选择,本质上是在定义”模型应该关注什么样的物理”。

论文投稿至Journal of Advances in Modeling Earth Systems后,审稿人提出了若干极具专业洞察力的意见,其中最具代表性的有三点:

  • 第一,关于单频率约束的物理充分性。审稿人指出,早期放弃Mie球形假设正是因其难以在多个频率上同时保持模拟精度,仅用166.5 GHz优化得到的散射性质未必在更宽频谱上成立。

  • 第二,关于ERA5的局限与神经网络的潜在补偿效应。ERA5的IFS模式中对流性水凝物(霰等致密冰相粒子)未作为独立预报量输出,神经网络可能通过过度增强雪粒子散射来弥补这一缺失。审稿人以台风”杜苏芮”为例,结合IFS云方案的双轨设计指出,眼墙区域由大尺度云方案主导、外围对流性雨带由对流参数化方案主导,这恰好对应了优化结果在眼墙改善显著、外围雨带改善有限的现象。这让我们意识到,AI模型的反常行为,往往是物理模式自身缺陷的折射。

  • 第三,关于优化结果的物理可解释性,审稿人建议将网络输出的散射性质与RTTOV预定义的粒子形状数据库进行对比,使其物理含义更加清晰。

针对这些意见,团队补充了多组敏感性试验,包括不同初始粒子形状训练的收敛性对比、与RTTOV各预定义粒子的比较等。审稿人最终给出了高度评价:”This remains a really outstanding piece of work and a pointer to the future of physical modelling. The authors have done a lot of extra work to address review comments and to look further at the results. All comments addressed.”(一项出色的工作,指向物理建模的未来方向。作者为回应评审意见做了大量额外工作,并对结果进行了更深入的分析,所有意见均已得到回应。)

这些经验也让团队形成了一个基本判断:AI与物理模式的融合,不应停留在”AI替代物理”的层面,而应为物理模式注入观测驱动的优化与学习能力。这是面向云雨区同化和下一代智能化数值预报体系值得继续深入的方向。

结语

本研究提出的PhySCAT-Net通过将物理辐射传输模式的正向与雅可比算子深度嵌入神经网络训练,首次实现了水凝物体散射性质在连续高维空间中的端到端可微分优化。在GPM/GMI 166.5 GHz双极化观测的验证中,该框架不仅显著降低了全球亮温模拟偏差,还成功从观测中直接学习到非球形粒子的偏振特性并再现了极化差与亮温的拱形关系。该研究开创了深度学习与物理模式融合的新范式,为构建下一代智能化数值天气预报体系奠定了重要基础。

文章信息

题目:

PhySCAT-Net: A physics-informed deep learning framework for optimizing hydrometeor bulk scattering properties using satellite observations.

期刊:

Journal of Advances in Modeling Earth Systems

第一作者:

李泽挺(zeting_li@foxmail.com) | 中国气象科学研究院与南京信息工程大学联合培养博士生。

通讯作者:

韩威 | 中国气象局地球系统数值预报中心副总工程师,主要研究方向为卫星数据同化、数据同化算法、人工智能与数值预报的结合。

其他作者:

毕磊| 浙江大学、教授;

孙修宇| 上海科学智能研究院、研究员;

李昊| 上海科学智能研究院、教授;

谢和俊| 浙江大学、博士;

徐孝泽| 上海科学智能研究院、博士。

基金支持: 

国家重点研发计划(2022YFC3004004)、国家自然科学基金(42075155)和上海市科学智能“百团百项”项目(2025-GZL-RGZN-BTBX-02025)

文章链接:

Li, Z., Han, W., Xie, H., et al. (2026). PhySCAT-Net: A physics-informed deep learning framework for optimizing hydrometeor bulk scattering properties using satellite observations. Journal of Advances in Modeling Earth Systems, 18(4), e2025MS005318. https://doi.org/10.1029/2025MS005318

参考:

[1] Li, Z., Han, W., Xu, X., Sun, X., & Li, H. (2024). All-sky microwave radiance observation operator based on deep learning with physical constraints. Journal of Geophysical Research: Atmospheres, 129(23), e2024JD042436. https://doi.org/10.1029/2024JD042436

[2] Li, Z., & Han, W. (2025). Impact of implementing all-sky radiance assimilation for FY-3E MWHS-2 in the CMA-GFS. Monthly Weather Review, 153(5), 847–863. https://doi.org/10.1175/MWR-D-24-0093.1

[3] Li, Y., Han, W., Duan, W., Li, Z., & Li, H. (2025). A machine learning-based observation operator for FY-4B GIIRS brightness temperatures considering the uncertainty of label data. Journal of Geophysical Research: Machine Learning and Computation, 2(1), e2024JH000449. https://doi.org/10.1029/2024JH000449

[4] Li, Y., Han, W., Li, H., Duan, W., Chen, L., Zhong, X., et al. (2024). FuXi-En4DVar: An assimilation system based on machine learning weather forecasting model ensuring physical constraints. Geophysical Research Letters, 51(22), e2024GL111136. https://doi.org/10.1029/2024GL111136

往期推荐:

从“晴空”到“全天候”:静止红外高光谱卫星资料同化在CMA-GFS中的突破(一)核心技术框架

从“晴空”到“全天候”:静止红外高光谱卫星资料同化在CMA-GFS中的突破(二)预报效益评估

物理+数据双驱动:机器学习如何重构气象数据同化全链条?

RSE 顶刊成果|“超椭球模型 + 偏振观测”破解冰云遥感难题

不再”挑天气”:中国气象局全球天气模式(CMA-GFS)首次实现微波湿度观测全天候同化