乐于分享
好东西不私藏

ECMWF重磅突破:AI首次"一统"大气-海洋-海冰-海浪,传统耦合模式终结了吗?

ECMWF重磅突破:AI首次"一统"大气-海洋-海冰-海浪,传统耦合模式终结了吗?

关注地球与工智能设置EarthAi星标

加EarthAi微信交流群+商务合作,请备注:姓名-行业-单位)

ECMWF数据驱动预报系统AIFS中的海洋表层表征:AI首次实现大气-海洋-海冰-海浪联合预报

https://arxiv.org/abs/2604.25559

研究背景:为什么需要”联合建模”?

传统数值天气预报(NWP)系统采用”分而治之”的策略:大气模式(如ECMWF的IFS)与海洋模式(如NEMO4)各自独立运行,通过预设的耦合接口每小时交换一次数据。这种架构虽然成熟,但存在三个固有缺陷:

  • 时间分辨率不匹配:大气模式通常运行在9km分辨率、450秒时间步长,而海洋模式为25km分辨率、1200秒步长,耦合过程本身会引入数值误差
  • 信息传递损耗:物理参数化方案对跨圈层过程(如海浪对海冰的阻尼、海气通量交换)做了大量人为假设
  • 计算资源瓶颈:多模式耦合的复杂架构限制了预报时效的提升

近年来,以ECMWF的AIFS(Artificial Intelligence Forecasting System)为代表的机器学习(ML)模型在大气预报领域取得突破,在中期预报时效上已超越传统数值模式,且计算成本大幅降低。然而,现有ML模型几乎都将大气视为孤立系统,海洋、海冰、海浪等分量仅通过训练数据(如ERA5再分析资料)间接”隐含”其中。

核心科学问题:这种”隐式表征”在中期预报时效(约10天)内是否足够?何时需要显式引入海洋分量?

核心创新:从”耦合”到”联合”

本文提出的AIFS Marine并非简单地将多个独立ML模型拼接,而是采用组件无关(component-agnostic)的联合建模策略:

  • 统一状态空间:大气、海洋表层、海冰、海浪所有变量被映射到同一个潜空间,模型不区分变量属于哪个地球系统分量
  • 共享表征学习:编码器-处理器-解码器架构中,注意力机制自动捕捉跨分量关联(如台风强风区与巨浪区、海冰边缘与波浪衰减区的空间一致性)
  • 端到端训练:通过单一损失函数同时优化所有变量的预报技巧,而非分模块独立训练

这种架构彻底颠覆了传统耦合范式——耦合不再需要人为预设,而是从数据中学习涌现。

技术突破:四大工程挑战与解决方案

缺失值处理:陆地掩码机制

海洋变量在陆地上无物理定义,存在大量NaN值。团队采用归一化空间置零+掩码屏蔽策略:训练时将NaN替换为0,但用掩码排除这些区域对损失的贡献;推理时重新应用掩码恢复缺失值。这避免了模型在陆地区域学习无意义的海洋增量。

物理边界约束:泄漏激活函数

针对海冰浓度([0,1])、海表温度(≥271.15K)等有严格物理边界的变量,传统HardTanh/ReLU会导致梯度消失(当预测值恰好在边界0时)。团队创新性地采用泄漏边界(Leaky Bounding)

  • 海冰浓度使用LeakyHardTanh,允许小梯度穿透边界(α=0.01)
  • 海表温度使用LeakyReLU,设置271.15K下界

实验证明,泄漏边界使预测值更集中于物理下界附近(图3),避免了非泄漏版本将负值全部截断为0导致的训练停滞。

方向变量连续化:三角函数重映射

平均波向(MWD,0°-360°)在边界处存在不连续性(359°与1°实际接近)。团队将其分解为sin(MWD)和cos(MWD)两个分量输入模型,彻底消除角度不连续问题。

损失函数平衡:多时间尺度加权

海洋变量(如海表温度日变化缓慢)与大气变量(如风场快速演变)的动态时间尺度差异巨大。团队设计双重损失缩放

  • 时间尺度补偿:慢变变量赋予更大损失权重,确保其微弱增量不被大气变量的强信号淹没
  • 分量间平衡:当同时加入海洋和海浪时,将海洋变量损失权重减半,防止大气预报技巧被”挤占”

实验设计:四级模型对比体系

模型版本
包含分量
处理器通道数
参数量
科学目标
AIFS Atmosphere
仅大气
1024
2.53亿
基准对照
AIFS Waves
大气+海浪
1024
2.53亿
海浪显式表征效应
AIFS Ocean
大气+海洋+海冰
1536
5.39亿
海气耦合效应
AIFS Marine
大气+海洋+海冰+海浪
1536
5.39亿
完整联合系统

注:含海洋分量的模型通道数增加50%以应对更复杂的耦合交互。

关键结果:海洋预报提升约1天,大气影响复杂

海浪预报:显著波高误差降低10%

AIFS Waves相对于ECMWF业务化海浪模式(ecWAM),在中期预报时效(4-5天)的显著波高(SWH)均方根误差(RMSE)降低约10%,等效于预报技巧延长约1天。这一提升在全球大部分海域成立,尤其在开阔大洋表现稳健。

海冰边缘的波浪衰减是检验物理一致性的关键场景。AIFS Waves(无显式海冰)在该区域表现较差——波浪能量未充分衰减;而AIFS Marine(含显式海冰)通过海冰浓度与波浪变量的联合学习,准确复现了海冰对波浪的阻尼效应(图5)。

海冰预报:南极边缘冰区大幅改善

采用综合冰缘误差(IIEE)评估,AIFS Ocean/Marine在南极的预报技巧显著优于IFS数值模式,IIEE降低幅度最大。北极改善相对温和。空间误差分析显示,改进集中在南极 marginal ice zone(边缘冰区),这与该区域海冰动力学主导、热力学结构影响较弱的特征一致。

值得注意的是,显式海浪信息对海冰边缘预报几乎无额外贡献——因为训练数据中海浪响应海冰而非反之,海浪不提供独立的冰缘演化信息。

海洋表层:温度提升明显,高度存在偏差

  • 海表温度(SST):AIFS Marine/Ocean在全区域优于IFS,尤其在南北半球中高纬度偏差显著降低。热带改进较小,因SST变率本身较弱。
  • 海表高度(SSH):出现系统性负偏差且随预报时效增长。作者归因于训练期(1993-2023)内全球海平面上升的单调趋势信号——模型倾向于预测训练期平均气候态,而非延续趋势。未来拟采用距平预报(预测SSH异常而非绝对值)解决。

对大气预报的”双刃剑”效应

  • 中性/微弱正面:加入海浪对大气500hPa位势高度、850hPa温度等核心评分几乎无影响,因ERA5训练数据已隐含海浪信息
  • 近地面温度改善:显式海冰使2米温度在极区提升15% RMSE;显式海洋改善热带2米温度技巧,因SST梯度和日变化被更精确保持
  • 近地面风场退化:10米风RMSE略有增加,反映海气数据集不一致性(ERA5强迫自OSTIA海温,而非ORAS6)对动量场的敏感影响

物理一致性验证:两个理想化实验

实验一:孤立 swell 传播

在平静海面上人为注入25-30秒长周期涌浪(无风强迫),AIFS Waves成功模拟了swell跨洋盆相干传播,并在风区生成新的风成浪系统。但无海冰分量时,南极海冰边缘出现虚假北移——证明显式海冰对极地波浪至关重要

实验二:完全移除初始海冰

将初始海冰浓度、体积、速度全部置零,并施加+2K SST扰动(加速融冰记忆衰减):

  • 恢复非瞬时:海冰不会立即重现,而是随大尺度热力学条件逐步恢复
  • 季节不对称:2月初始化时北极先恢复(冬季热力条件有利),南极延迟至秋季;8月则相反
  • 体积恢复慢于范围:范围(extent)在冻结条件重建后快速增加,体积(volume)因冰厚增长的热力学自限性(冰越厚隔热越强,增长越慢)而缓慢累积,符合数值模式spin-up行为

该实验证实联合模型并非简单记忆初始场,而是具备真实的热力学响应能力

台风案例:跨圈层耦合的”压力测试”

针对2023年8月飓风Idalia和Franklin,AIFS Marine展现了与IFS高度一致的跨分量响应(图1):

  • 大气:强风区与2米露点温度、10米风速的台风结构清晰
  • 海浪:显著波高与风场空间对齐,台风路径上浪高增强
  • 海洋:台风过境后海表温度出现负异常(cold wake),源于风驱动混合将次冷水卷入表层
  • 海表高度:气旋式环流驱动海水向佛罗里达西海岸堆积,形成正高度异常(风暴潮信号)

这种多变量物理一致性完全从数据中学习,无需预设任何耦合方案。

局限与展望

  1. 数据集一致性瓶颈:ERA5(大气)与ORAS6(海洋)的海表强迫不一致(ERA5用OSTIA,ORAS6用ERA5自身),导致联合训练时近表面大气场存在噪声。未来需发展耦合再分析或采用更灵活的基础模型架构(如Aurora的掩码策略)
  2. 趋势变量处理:SSH等含长期趋势的量需转为距平预报
  3. 深度海洋缺失:当前仅表层海洋(2D),次表层热盐结构对季节尺度记忆至关重要
  4. 概率预报扩展:正向概率联合模型(如扩散模型、CRPS训练)发展,AIFS-Thalassa已开展次季节试验

结论

本研究标志着数据驱动地球系统模型的重要里程碑:首次证明单一ML架构可在统一潜空间中联合预报大气、海洋、海冰、海浪四大分量,且多数海洋变量技巧超越传统物理模式约1天。联合建模消除了显式耦合的技术复杂性,使跨圈层关联直接从数据涌现。尽管大气评分受数据集一致性制约存在轻微权衡,但物理一致性验证(理想化实验、台风案例)表明系统具备可靠的热力学与动力学响应。这为未来构建全耦合AI地球系统模型奠定了坚实基础。


本文解读如有偏差欢迎联系小编,感谢!

EarthAi

微信公号:Earth-Ai

商务联系:Earth_Ai