FuXi-Ocean亚日级全球海洋AI预报系统技术深度解读

一、研究背景与行业发展痛点

》》（一）全球海洋预报的核心应用刚需

1.海上作业与应急场景的高频预报需求

（1）海上搜救与溢油处置的时效性要求

① 海洋突发事故的处置窗口通常以小时为单位，漂流目标轨迹、溢油扩散范围直接受六小时内海流、温盐结构变化影响，日尺度预报产品无法捕捉快速演变的海洋过程，易导致处置方案滞后、风险扩大。

② 近岸工程作业、海上平台运维等场景，需要亚日级的海洋状态预报支撑施工窗口选择、风险预案制定，传统数值模式难以兼顾全球覆盖与高频更新的双重需求。

（2）远洋航运与海上能源开发的安全保障需求

① 全球航运航线优化需要精细化的海流、海表高度预报数据，亚日级预报可精准捕捉中尺度涡旋、锋面等对船舶航行阻力、航行安全的影响，实现燃油消耗优化与极端海况规避。

② 海上风电、深海油气开发等工程，需要全深度的海洋环境预报支撑结构安全设计、施工周期规划，对温跃层、深层海流的预报精度与时间分辨率提出极高要求。

2.海洋资源管理与生态保护的精细化支撑需求

（1）渔业资源的可持续开发管理，依赖对水温、盐度、海流场的高频精准预报，以此判断鱼类洄游路径、聚集区域，实现限额捕捞与资源养护的双重目标。

（2）海洋生态保护、赤潮与有害藻华预警，需要捕捉表层海洋昼夜尺度的环境变化，亚日级预报可提前识别藻华爆发的环境条件，为近岸生态管控提供前置窗口期。

3.全球气候研究的全深度海洋数据需求

海洋是全球气候系统的核心热量与碳汇载体，温跃层、中层海洋的温盐结构变化，直接影响全球热量输送、气候模态演变。高时间分辨率、全深度覆盖的海洋预报产品，可为气候模式校准、年际气候事件预测提供关键数据支撑。

》》（二）传统数值海洋预报体系的技术瓶颈

1.高分辨率模拟的计算资源壁垒

（1）实现中尺度涡旋解析的全球海洋预报，需要将网格分辨率提升至1/12°及以下，全球范围内的密集网格会带来计算量的指数级增长。即便依托顶级超算平台，传统数值模式完成一次全球高分辨率预报，也需要耗费数小时的计算时间，难以实现高频次、业务化的滚动更新。

（2）高分辨率模拟的算力与电力消耗极高，仅少数发达国家与机构具备业务化运行能力，中小机构、沿海发展中国家难以获取同等精度的预报服务，形成显著的技术壁垒。

2.次网格过程参数化的固有系统偏差

（1）海洋内部的垂直混合、海气相互作用、底摩擦、小尺度湍流等过程，无法在现有网格尺度下直接解析，必须通过参数化方案进行近似表达。不同数值模式的参数化逻辑存在差异，会引入系统性的预报偏差，且偏差在亚日级高频预报中会被快速放大。

（2）参数化方案的校准高度依赖专家经验与局部海域观测数据，难以在全球范围内实现均衡优化，导致西部边界流、赤道太平洋、南极绕极流等关键区域的预报精度始终难以突破。

3.混沌特性下的高频预报误差放大问题

海洋系统具备强非线性与混沌特性，初始场的微小误差会在非线性动力过程中快速扩散。传统数值模式在亚日级高频预报中，初始场误差、参数化误差会在短时间内快速累积，导致高频预报的可信度远低于日平均预报产品。

》》（三）数据驱动海洋预报的发展现状与核心局限

1.现有数据驱动模型的技术进展

近年来，以深度学习为核心的数据驱动方法，为海洋预报提供了全新技术路径。相关研究成果已证实，数据驱动模型在日分辨率全球海洋预报中，可达到甚至超越传统数值模式的预报精度，同时推理效率提升上千倍，大幅降低预报的计算成本。

2.亚日级高频预报的核心技术壁垒

（1）现有数据驱动海洋预报模型，时间分辨率普遍停留在日尺度，无法适配海洋变量的多时间尺度差异——表层海温具备显著的昼夜循环特征，深层海流的演变周期长达数天至数月，单一时间尺度的建模逻辑无法同时适配快慢两种过程。

（2）自回归滚动预报的误差累积问题，在亚日级高频预报中更为突出。高频次的迭代预报会让误差快速叠加，现有模型缺乏针对性的误差抑制机制，导致预报性能随迭代次数增加急剧下降。

3.垂直覆盖与数据依赖的固有局限

（1）现有数据驱动模型的垂直覆盖深度普遍不超过700米，无法捕捉温跃层以下中层海洋的动力过程，难以支撑全深度海洋工程与科研需求。

（2）多数模型高度依赖风速、气压等大气强迫场作为输入，不仅增加了数据预处理成本与外部数据依赖，还会将大气场的预报误差引入海洋预报体系，进一步降低预报可信度。

二、FuXi-Ocean核心定位与技术创新体系

》》（一）系统核心定位与关键技术指标

1.系统核心定位

FuXi-Ocean是全球首个基于深度学习的数据驱动全球海洋预报系统，实现了六小时亚日级时间分辨率、1/12°涡旋解析空间分辨率、0至1500米全深度覆盖的三维海洋状态预报。系统不依赖大气强迫场数据，仅通过历史海洋状态即可实现端到端滚动预报，在保持高精度的同时大幅降低业务化运行门槛。

2.关键技术指标

（1）时间分辨率：六小时，完整覆盖海洋昼夜循环与惯性振荡过程。

（2）空间分辨率：1/12°，具备全球中尺度涡旋解析能力。

（3）深度覆盖：0至1500米，设置20个垂直分层，表层加密布设以捕捉上层海洋动力过程。

（4）预报变量：海水温度、海水盐度、海流纬向分量、海流经向分量、海表高度，总计81个数据通道。

（5）数据效率：仅使用8.5年的再分析数据完成训练，数据需求量远低于同类数据驱动模型。

（6）输入依赖：仅使用海洋状态变量，无需接入风速、气压等大气强迫数据。

》》（二）核心技术创新框架

1.自适应多时间尺度融合的时序建模创新

提出Mixture-of-Time（MoT）时间混合模块，针对不同海洋变量、不同深度层的时间演化特性，自适应学习不同时间窗口的预报可靠性，动态选择最优时序信息进行融合，从根源上抑制自回归预报的误差累积问题。

2.上下文感知的多尺度海洋特征提取架构

设计融合时空先验信息的特征提取模块，通过可学习的空间嵌入与正弦时间编码，将地理坐标、水深、季节与日周期等先验知识融入特征编码过程，使模型具备区域自适应能力，可精准区分表层快速过程与深层缓慢过程的动力学差异。

3.球面适配的训练优化体系

构建纬度加权的损失函数与两阶段递进式训练策略，解决球面网格平面投影带来的高纬度权重偏差问题，同时通过单步预训练与多步微调的结合，平衡模型的短时预报精度与长期预报稳定性。

4.纯海洋变量驱动的端到端预报范式

突破现有模型对大气强迫场的依赖，仅通过历史海洋状态变量实现精准预报，大幅降低外部数据依赖，提升系统的独立性、鲁棒性与可部署性。

三、系统整体架构与核心模块设计

》》（一）整体技术框架

图 1：海洋预报框架架构

1.自回归滚动预报的核心逻辑

FuXi-Ocean采用自回归架构，以连续四个时刻、覆盖24小时的历史海洋三维状态作为输入，预测未来六小时的海洋状态，并将预测结果作为新的输入迭代代入模型，实现多步长滚动预报。

2.端到端的数据流设计

（1）输入层：接收多深度、多变量的海洋状态时序数据，通过海陆掩码过滤陆地区域无效值，保证数据的物理一致性。

（2）特征编码层：通过上下文感知特征提取模块，完成空间下采样、时空先验融合与多时相特征拼接，生成高维时空特征。

（3）时序预测层：通过堆叠注意力块捕捉长程时空依赖，完成海洋状态的时序演化建模，生成深层预测特征。

（4）解码融合输出层：通过解码器恢复高分辨率空间结构，经MoT模块完成多时序信息融合，输出最终的六小时预报结果。

》》（二）上下文感知特征提取模块

1.多通道海洋变量的统一编码架构

模块采用共享卷积编码器，对不同深度、不同物理量的海洋变量进行统一特征映射，通过匹配卷积核与步长的卷积层实现空间下采样，配合层归一化操作稳定特征分布，在降低计算量的同时，保留不同变量的物理特性差异。

2.时空先验信息的自适应融合机制

（1）构建时空先验信息网络，对纬度、经度、水深等空间信息进行可学习嵌入，对日周期、季节周期等时间信息进行正弦位置编码，生成全局时空上下文特征。

（2）将时空上下文特征与卷积编码特征进行动态融合，通过权重调制的方式，让编码器对不同海域、不同季节的海洋特征具备自适应捕捉能力，可精准识别边界流、赤道流、涡旋活跃区等典型海洋结构的特殊演化规律。

3.多时相特征的有序拼接与融合策略

模块对四个连续时刻的编码特征，在通道维度进行有序拼接，完整保留24小时内的时序演化信息；随后通过1×1卷积与归一化层完成跨时刻特征融合，在不丢失空间细节的前提下，构建包含完整时序信息的融合特征，为后续时序预测提供基础。

》》（三）堆叠注意力时序预测模块

1.长程时空依赖捕捉的注意力块设计

预测模块以堆叠的注意力块为核心组件，通过自注意力机制自动捕捉海洋变量在空间、深度、时间三个维度的长程依赖关系，可自动聚焦对未来状态影响最大的区域与深度层，比如强海流区、温跃层、涡旋核心区等，大幅提升关键区域的预报精度。

2.自适应层归一化的区域适配机制

模块引入自适应层归一化机制，将时空上下文特征动态融入归一化参数调整过程，使模型在不同纬度、不同深度、不同季节的海洋环境中，均可保持稳定的特征表达，有效缓解热带与寒带、表层与深层海洋动力学差异带来的建模困难。

3.跳跃连接的细粒度空间细节保留策略

模块采用编码器-解码器结构，解码器通过转置卷积将低分辨率预测特征，逐步恢复至原始高分辨率网格；同时在编码器与对应解码器层之间建立跳跃连接，将编码阶段的浅层细粒度特征直接传递至解码阶段，避免下采样与预测过程中丢失涡旋、锋面等小尺度海洋结构的空间细节。

》》（四）Mixture-of-Time（MoT）时间混合核心模块

1.海洋变量多时间尺度差异的核心问题适配

不同海洋变量、不同深度层的演化速度存在数量级差异：表层海温具备显著的昼夜周期，变化速度快；深层海流与盐度结构演化缓慢，依赖更长时间尺度的历史信息。单一时间窗口的建模逻辑，无法同时适配所有变量的时间尺度特性，MoT模块针对这一核心问题进行专属设计。

2.通道级可靠性权重的动态学习机制

（1）模块以通道为最小单位进行权重分配，每一个通道对应一个物理量与一个深度层的组合。模块维护专属的可靠性矩阵，记录每一类变量在不同历史时间窗口下的预报误差水平，以此量化不同时间窗口的预报可信度。

（2）训练过程中，模块根据实时预报误差，通过动量更新机制持续优化可靠性权重，使模型逐步学会为快速变化的表层变量选择短时序上下文，为稳定的深层变量选择长时序上下文，实现变量专属的时间依赖建模。

3.多时序分支的最优信息融合策略

模块对来自不同历史时刻的预测分支，基于可靠性权重进行自适应筛选与加权融合，保留预报可信度最高的时序信息，过滤误差较大的分支输出。这种融合方式，使模型可针对不同变量动态选择最优的时序上下文，无需增加模型复杂度即可大幅提升预报精度。

4.自回归误差累积的抑制机制

在滚动预报过程中，MoT模块可动态调整对不同历史时刻预报结果的依赖权重，避免早期迭代产生的误差持续累积并主导后续预报结果，显著延长有效预报时长，提升多步滚动预报的稳定性与一致性。

四、训练体系与优化策略

》》（一）纬度加权的损失函数设计

1.球面网格投影的权重适配逻辑

地球为球形表面，传统等权重损失函数在将球面网格投影为平面矩形网格时，会过度放大高纬度区域的误差权重，导致低纬度关键海域的误差被低估。该系统采用纬度加权损失函数，基于纬度余弦值对不同区域的误差进行动态加权，使模型在全球范围内保持均衡的优化目标，重点提升热带、副热带、赤道海域等关键区域的预报精度。

2.异常值鲁棒的损失函数特性

损失函数采用Charbonnier损失形式，对再分析数据中的异常值具备极强的鲁棒性，可避免模型对局部异常观测点过拟合，在包含噪声的训练数据中，稳定学习海洋系统的真实演化规律。

》》（二）两阶段递进式训练机制

1.单步预报预训练的基础能力构建

第一阶段采用单步预报目标进行预训练，让模型快速学习海洋状态六小时尺度的短时演变规律，建立稳定的特征提取能力与基础预测能力，为后续多步训练提供优质的初始参数，加快整体收敛速度。

2.多步滚动微调的长期稳定性优化

第二阶段引入多步滚动损失，对连续多步的滚动预报结果同步施加约束。该机制强制模型在预测过程中，兼顾未来多时刻的预报一致性，从训练阶段抑制误差在滚动过程中的快速增长，显著提升中长期预报的稳定性与精度。

》》（三）优化器与学习率调度策略

系统采用AdamW优化器，配合余弦退火学习率调度策略。训练初期使用较高的学习率，实现模型参数的快速收敛；训练后期逐步降低学习率，完成模型参数的精细调优。该组合在大规模海洋时空数据的训练中，表现出极强的稳定性与收敛效率，可在有限迭代次数内达到最优预报性能。

》》（四）物理一致性约束的训练策略

训练全过程对所有输入与输出变量施加海陆掩码约束，确保模型仅在海洋格点上进行特征学习与预报输出，陆地区域保持无效值，避免引入非物理的干扰信息，保证预报场的物理一致性与合理性。

五、实验验证体系与性能解析

》》（一）数据集构建与验证体系设计

1.训练与测试数据集构建

系统采用HYCOM全球海洋再分析数据完成训练与测试，该数据是全球少数公开的六小时分辨率海洋再分析产品，具备1/12°空间分辨率与多层垂直结构，覆盖海面至5000米深度，可满足高分辨率模型的训练需求。

（1）训练集覆盖2006年1月至2014年6月，总时长约8.5年，远低于同类模型常用的十几年训练数据量。

（2）验证集采用2014年7月至12月的数据，用于模型超参数调优与过拟合监控。

（3）测试集采用2015年全年的独立数据，用于评估模型的泛化能力与预报性能。

2.实际观测验证体系

采用国际通用的GODAE OceanView IV-TT海洋预报验证框架，基于全球漂流浮标、卫星遥感、Argo剖面等实际观测数据，完成模型真实场景下的性能验证。验证过程中对异常观测值进行严格过滤，剔除偏离物理规律的离群点，同时将不规则分布的观测数据插值至模型网格，实现预报结果与观测数据的点对点公平对比。

3.核心评估指标

采用纬度加权均方根误差作为核心评估指标，该指标充分考虑不同纬度格点的面积差异，可真实反映模型全球预报的整体性能。同时结合误差空间分布、垂直分布、随预报时长的演化规律等多维度分析，全面评估模型的综合性能。

》》（二）全球空间预报性能解析

图 2：海表变量全球均方根误差（RMSE）分布

1.海表温度预报性能

六小时时效的海表温度预报，在热带与副热带海域的误差普遍低于0.3℃，表现出极强的稳定性。误差主要集中在湾流、黑潮、南极绕极流等西部边界流区域，这类区域中尺度涡旋活动强烈、动力过程复杂，是全球海洋预报的公认难点，即便在此类区域，模型仍可保持业务化应用可接受的误差范围。

2.盐度预报性能

盐度预报的空间误差分布与海表温度相似，在河口、强降水区、极地融冰区等淡水通量变化剧烈的区域，误差略有上升，完全符合海洋物理规律。赤道太平洋海域的盐度预报，在所有预报时效下均保持极高精度，体现出模型对热带海洋过程的强表征能力。

3.海流预报性能

短时效下，海流纬向与经向分量的误差空间分布高度一致；随预报时长增加，赤道区域两个分量的误差出现显著差异，与南北半球海流旋转方向不同的物理特征完全吻合。西部边界流区域的海流预报误差略高，但整体保持稳定，无异常增长。

》》（三）全深度垂直预报性能解析

1.全深度预报稳定性

模型在0至1500米的全深度范围内，保持连续稳定的预报能力，预报误差随深度增加缓慢上升，无突变层或异常恶化层。深层海洋的预报误差增长平缓，证实MoT模块可有效适配深层海洋缓慢变化的动力学特性。

2.温跃层预报性能

温跃层位于100米至300米深度区间，是海水温度、密度、海流变化最剧烈的区域，预报难度极高。模型在该深度区间的误差略有上升，但仍保持在业务化应用可接受的范围，证明模型可精准捕捉温跃层的垂直结构与动态演化规律。

3.多层误差演化一致性

不同预报时效下，各深度层的误差增长趋势高度一致，无单一深度层出现显著的性能恶化，说明模型在垂直方向上的建模均衡，可同时适配表层、次表层、中层海洋的不同时间尺度动力学过程。

》》（四）与主流业务化系统的对比验证

在海表温度预报任务中，与国际主流业务化数值模式HYCOM、BLK、FOAM的直接对比结果显示，在相同的验证框架下，该系统的预报误差显著低于对比的传统数值模式，且误差随预报时长的增长速度更慢。

值得注意的是，模型的训练数据仅截至2014年，而观测验证数据来自2022年，时间跨度长达8年，模型仍可实现优于传统数值模式的预报性能，证实模型学习到的海洋演化规律具备高度的普适性，而非对训练样本的简单记忆。

》》（五）消融实验与创新点有效性验证

图 3：基于 HYCOM 再分析数据的不同方法消融实验

1.移除MoT模块的性能变化

移除MoT模块后，海水温度、盐度、海表高度的预报误差出现显著上升，最大增幅接近40%，其中短时效预报的性能下降最为明显，证实MoT模块对高频快速海洋过程的建模至关重要，是系统核心性能的核心支撑。

2.缩减历史输入时刻的性能变化

将历史输入从4个时刻缩减至2个时刻后，模型在长时效预报中的性能出现明显下降，说明足够长度的时序上下文，对捕捉海洋昼夜周期与惯性振荡过程不可或缺。

3.不同变量的敏感度差异

海流分量对MoT模块与历史输入长度的敏感度，显著低于温盐变量，这一现象与海洋物理规律完全吻合——表层海流主要受瞬时风场与地转平衡控制，对历史状态的依赖较弱。该结果为后续多分支专用模型的设计，提供了重要的理论参考。

六、技术优势与落地应用场景

》》（一）核心技术竞争优势

1.亚日级高频预报的能力突破

实现全球首个六小时分辨率的数据驱动海洋预报，可完整捕捉海洋昼夜变化、惯性振荡、潮流变化、短时锋生锋消等快速过程，填补了数据驱动模型在亚日级高频预报领域的技术空白。

2.全深度涡旋解析的精细化建模能力

1/12°的涡旋解析空间分辨率，配合0至1500米的深度覆盖，使模型可同时支撑从表层到中层海洋的三维结构分析，全面满足海洋科研、工程、应急等多场景的精细化需求。

3.极致的计算效率与部署门槛优势

模型推理速度远超传统数值模式，可在普通GPU设备上完成全球实时预报，无需依赖超级计算平台，大幅降低海洋预报的业务化运行门槛。

4.高数据效率与低外部依赖特性

仅需8.5年的再分析数据即可完成训练，数据需求量远低于同类模型；同时不依赖大气强迫场输入，大幅降低外部数据依赖与预处理成本，提升系统的独立性与鲁棒性。

》》（二）核心落地应用场景

1.海上应急救援与突发环境事件处置

六小时高频海流与温盐预报，可大幅提升海上漂流目标的轨迹预测精度，缩短搜救响应时间，提高遇险人员生还率；同时可为溢油、危化品泄漏等突发海洋环境事件，提供精准的扩散路径预报，支撑应急处置方案的快速制定与优化。

2.远洋航运与海上能源工程安全保障

高频高分辨率的海洋预报产品，可帮助远洋船舶精准规避强涡旋、极端海况，优化航行路线，降低燃油消耗与航行风险；同时可为海上风电、深海油气平台的建设与运维，提供全深度的海洋环境预报，支撑施工窗口选择与结构安全设计。

3.渔业资源管理与海洋生态保护

精准的温盐、流场预报，可有效分析鱼类洄游路径与聚集区域，支撑渔业资源的限额捕捞与可持续管理；同时可提前识别赤潮、有害藻华爆发的环境条件，为近岸海洋生态保护提供前置预警窗口。

4.海岸带灾害防御与近海管理

高频海洋预报可支撑风暴潮、海岸洪水、近岸侵蚀等海岸带灾害的预警预报，提升沿海地区的灾害防御能力；同时可为近岸海域功能区划、围填海管控、海洋环境容量评估提供精细化的数据支撑。

5.全球海洋与气候科学研究

高分辨率、长时间序列的海洋预报产品，可为中尺度海洋过程、海洋能量传递、物质输运、全球气候变化等基础研究，提供高质量的三维数据支撑，推动海洋科学与气候科学的研究进展。

七、现存局限与未来演进方向

》》（一）当前技术体系的现存局限

1.训练数据的再分析产品依赖问题

模型训练基于数值模式再分析数据，不可避免地继承了再分析数据中的固有偏差，对模型的真实场景预报能力存在一定影响。

2.全海深覆盖的能力缺口

当前模型的最大预报深度为1500米，未覆盖深海与深渊海域，无法支撑全海深的海洋动力学研究与工程应用。

3.长周期预报能力待拓展

模型在10天以内的中短期预报中表现优异，但季节与年际尺度的长期预报能力尚未完成系统验证，对海洋慢变过程的建模能力仍有提升空间。

4.显式物理约束的融入不足

模型以纯数据驱动为主，未显式融入质量守恒、动量守恒、盐度守恒等海洋物理基本定律，在极端海洋事件的预报中，可能出现非物理的预报结果。

》》（二）未来技术演进核心方向

1.全海深预报能力的拓展

将模型的垂直覆盖深度扩展至5000米全海深，构建全球全海深的AI海洋预报模型，支撑深海科研与工程应用。

2.物理守恒定律的显式约束融入

在模型结构与损失函数中，显式加入海洋物理基本守恒定律的约束，提升预报场的物理一致性与极端场景下的预报可信度。

3.小时级超高分辨率预报能力的构建

进一步将预报时间分辨率提升至1小时，支撑潮汐、近岸浪流耦合、海岸带突发灾害等更高频过程的精准预报。

4.多源异构观测数据的融合建模

融合卫星遥感、Argo剖面、船测、浮标等多源异构观测数据，构建弱依赖再分析数据的纯观测驱动模型，降低数值模式偏差的影响。

5.集合预报与不确定性量化体系的完善

构建集合预报体系，输出概率预报产品与预报不确定性区间，为业务化决策提供更全面的参考信息，提升预报结果的应用价值。

八、行业价值与发展总结

》》（一）对海洋预报行业的技术变革价值

FuXi-Ocean的技术突破，证实数据驱动方法可在亚日级、高分辨率、全深度的全球海洋预报中，超越传统业务化数值模式，标志着全球海洋预报行业正式进入AI驱动的全新发展阶段。其轻量化、高效率、高精度、低门槛的技术特性，打破了传统数值模式的超算资源壁垒，推动海洋预报技术的全球普及与普惠。

》》（二）对全球海洋治理与开发的支撑价值

该系统可广泛应用于海上安全、应急处置、资源开发、生态保护、气候研究等多个领域，为全球海洋治理、海洋经济可持续发展、海洋灾害防御提供核心技术支撑。尤其对中小国家与沿海地区，可大幅降低高精度海洋预报的获取门槛，提升全球海洋灾害的整体防御能力。

》》（三）技术发展总结

FuXi-Ocean突破了传统海洋预报的多项核心技术瓶颈，通过MoT时间混合模块、上下文感知特征提取、球面适配训练体系等多项创新，实现了亚日级、涡旋解析、全深度的全球海洋AI预报，在技术指标与实际性能上均达到全球领先水平。随着模型的持续迭代优化、物理约束的不断融入、多源观测数据的深度融合，AI驱动的海洋预报技术，将在全球海洋治理与开发中发挥越来越核心的作用。

文章来源：Qiusheng Huang, Yuan Niu, Xiaohui Zhong, et al. FuXi-Ocean: A Global Ocean Forecasting System with Sub-Daily. arXiv, 2506, 03210 .