
一、研究背景与行业发展痛点
》》(一)全球海洋预报的核心应用刚需
1.海上作业与应急场景的高频预报需求
(1)海上搜救与溢油处置的时效性要求
① 海洋突发事故的处置窗口通常以小时为单位,漂流目标轨迹、溢油扩散范围直接受六小时内海流、温盐结构变化影响,日尺度预报产品无法捕捉快速演变的海洋过程,易导致处置方案滞后、风险扩大。
② 近岸工程作业、海上平台运维等场景,需要亚日级的海洋状态预报支撑施工窗口选择、风险预案制定,传统数值模式难以兼顾全球覆盖与高频更新的双重需求。
(2)远洋航运与海上能源开发的安全保障需求
① 全球航运航线优化需要精细化的海流、海表高度预报数据,亚日级预报可精准捕捉中尺度涡旋、锋面等对船舶航行阻力、航行安全的影响,实现燃油消耗优化与极端海况规避。
② 海上风电、深海油气开发等工程,需要全深度的海洋环境预报支撑结构安全设计、施工周期规划,对温跃层、深层海流的预报精度与时间分辨率提出极高要求。
2.海洋资源管理与生态保护的精细化支撑需求
(1)渔业资源的可持续开发管理,依赖对水温、盐度、海流场的高频精准预报,以此判断鱼类洄游路径、聚集区域,实现限额捕捞与资源养护的双重目标。
(2)海洋生态保护、赤潮与有害藻华预警,需要捕捉表层海洋昼夜尺度的环境变化,亚日级预报可提前识别藻华爆发的环境条件,为近岸生态管控提供前置窗口期。
3.全球气候研究的全深度海洋数据需求
海洋是全球气候系统的核心热量与碳汇载体,温跃层、中层海洋的温盐结构变化,直接影响全球热量输送、气候模态演变。高时间分辨率、全深度覆盖的海洋预报产品,可为气候模式校准、年际气候事件预测提供关键数据支撑。
》》(二)传统数值海洋预报体系的技术瓶颈
1.高分辨率模拟的计算资源壁垒
(1)实现中尺度涡旋解析的全球海洋预报,需要将网格分辨率提升至1/12°及以下,全球范围内的密集网格会带来计算量的指数级增长。即便依托顶级超算平台,传统数值模式完成一次全球高分辨率预报,也需要耗费数小时的计算时间,难以实现高频次、业务化的滚动更新。
(2)高分辨率模拟的算力与电力消耗极高,仅少数发达国家与机构具备业务化运行能力,中小机构、沿海发展中国家难以获取同等精度的预报服务,形成显著的技术壁垒。
2.次网格过程参数化的固有系统偏差
(1)海洋内部的垂直混合、海气相互作用、底摩擦、小尺度湍流等过程,无法在现有网格尺度下直接解析,必须通过参数化方案进行近似表达。不同数值模式的参数化逻辑存在差异,会引入系统性的预报偏差,且偏差在亚日级高频预报中会被快速放大。
(2)参数化方案的校准高度依赖专家经验与局部海域观测数据,难以在全球范围内实现均衡优化,导致西部边界流、赤道太平洋、南极绕极流等关键区域的预报精度始终难以突破。
3.混沌特性下的高频预报误差放大问题
海洋系统具备强非线性与混沌特性,初始场的微小误差会在非线性动力过程中快速扩散。传统数值模式在亚日级高频预报中,初始场误差、参数化误差会在短时间内快速累积,导致高频预报的可信度远低于日平均预报产品。
》》(三)数据驱动海洋预报的发展现状与核心局限
1.现有数据驱动模型的技术进展
近年来,以深度学习为核心的数据驱动方法,为海洋预报提供了全新技术路径。相关研究成果已证实,数据驱动模型在日分辨率全球海洋预报中,可达到甚至超越传统数值模式的预报精度,同时推理效率提升上千倍,大幅降低预报的计算成本。
2.亚日级高频预报的核心技术壁垒
(1)现有数据驱动海洋预报模型,时间分辨率普遍停留在日尺度,无法适配海洋变量的多时间尺度差异——表层海温具备显著的昼夜循环特征,深层海流的演变周期长达数天至数月,单一时间尺度的建模逻辑无法同时适配快慢两种过程。
(2)自回归滚动预报的误差累积问题,在亚日级高频预报中更为突出。高频次的迭代预报会让误差快速叠加,现有模型缺乏针对性的误差抑制机制,导致预报性能随迭代次数增加急剧下降。
3.垂直覆盖与数据依赖的固有局限
(1)现有数据驱动模型的垂直覆盖深度普遍不超过700米,无法捕捉温跃层以下中层海洋的动力过程,难以支撑全深度海洋工程与科研需求。
(2)多数模型高度依赖风速、气压等大气强迫场作为输入,不仅增加了数据预处理成本与外部数据依赖,还会将大气场的预报误差引入海洋预报体系,进一步降低预报可信度。
二、FuXi-Ocean核心定位与技术创新体系
》》(一)系统核心定位与关键技术指标
1.系统核心定位
FuXi-Ocean是全球首个基于深度学习的数据驱动全球海洋预报系统,实现了六小时亚日级时间分辨率、1/12°涡旋解析空间分辨率、0至1500米全深度覆盖的三维海洋状态预报。系统不依赖大气强迫场数据,仅通过历史海洋状态即可实现端到端滚动预报,在保持高精度的同时大幅降低业务化运行门槛。
2.关键技术指标
(1)时间分辨率:六小时,完整覆盖海洋昼夜循环与惯性振荡过程。
(2)空间分辨率:1/12°,具备全球中尺度涡旋解析能力。
(3)深度覆盖:0至1500米,设置20个垂直分层,表层加密布设以捕捉上层海洋动力过程。
(4)预报变量:海水温度、海水盐度、海流纬向分量、海流经向分量、海表高度,总计81个数据通道。
(5)数据效率:仅使用8.5年的再分析数据完成训练,数据需求量远低于同类数据驱动模型。
(6)输入依赖:仅使用海洋状态变量,无需接入风速、气压等大气强迫数据。
》》(二)核心技术创新框架
1.自适应多时间尺度融合的时序建模创新
提出Mixture-of-Time(MoT)时间混合模块,针对不同海洋变量、不同深度层的时间演化特性,自适应学习不同时间窗口的预报可靠性,动态选择最优时序信息进行融合,从根源上抑制自回归预报的误差累积问题。
2.上下文感知的多尺度海洋特征提取架构
设计融合时空先验信息的特征提取模块,通过可学习的空间嵌入与正弦时间编码,将地理坐标、水深、季节与日周期等先验知识融入特征编码过程,使模型具备区域自适应能力,可精准区分表层快速过程与深层缓慢过程的动力学差异。
3.球面适配的训练优化体系
构建纬度加权的损失函数与两阶段递进式训练策略,解决球面网格平面投影带来的高纬度权重偏差问题,同时通过单步预训练与多步微调的结合,平衡模型的短时预报精度与长期预报稳定性。
4.纯海洋变量驱动的端到端预报范式
突破现有模型对大气强迫场的依赖,仅通过历史海洋状态变量实现精准预报,大幅降低外部数据依赖,提升系统的独立性、鲁棒性与可部署性。
三、系统整体架构与核心模块设计
》》(一)整体技术框架

图 1:海洋预报框架架构
1.自回归滚动预报的核心逻辑
FuXi-Ocean采用自回归架构,以连续四个时刻、覆盖24小时的历史海洋三维状态作为输入,预测未来六小时的海洋状态,并将预测结果作为新的输入迭代代入模型,实现多步长滚动预报。
2.端到端的数据流设计
(1)输入层:接收多深度、多变量的海洋状态时序数据,通过海陆掩码过滤陆地区域无效值,保证数据的物理一致性。
(2)特征编码层:通过上下文感知特征提取模块,完成空间下采样、时空先验融合与多时相特征拼接,生成高维时空特征。
(3)时序预测层:通过堆叠注意力块捕捉长程时空依赖,完成海洋状态的时序演化建模,生成深层预测特征。
(4)解码融合输出层:通过解码器恢复高分辨率空间结构,经MoT模块完成多时序信息融合,输出最终的六小时预报结果。
》》(二)上下文感知特征提取模块
1.多通道海洋变量的统一编码架构
模块采用共享卷积编码器,对不同深度、不同物理量的海洋变量进行统一特征映射,通过匹配卷积核与步长的卷积层实现空间下采样,配合层归一化操作稳定特征分布,在降低计算量的同时,保留不同变量的物理特性差异。
2.时空先验信息的自适应融合机制
(1)构建时空先验信息网络,对纬度、经度、水深等空间信息进行可学习嵌入,对日周期、季节周期等时间信息进行正弦位置编码,生成全局时空上下文特征。
(2)将时空上下文特征与卷积编码特征进行动态融合,通过权重调制的方式,让编码器对不同海域、不同季节的海洋特征具备自适应捕捉能力,可精准识别边界流、赤道流、涡旋活跃区等典型海洋结构的特殊演化规律。
3.多时相特征的有序拼接与融合策略
模块对四个连续时刻的编码特征,在通道维度进行有序拼接,完整保留24小时内的时序演化信息;随后通过1×1卷积与归一化层完成跨时刻特征融合,在不丢失空间细节的前提下,构建包含完整时序信息的融合特征,为后续时序预测提供基础。
》》(三)堆叠注意力时序预测模块
1.长程时空依赖捕捉的注意力块设计
预测模块以堆叠的注意力块为核心组件,通过自注意力机制自动捕捉海洋变量在空间、深度、时间三个维度的长程依赖关系,可自动聚焦对未来状态影响最大的区域与深度层,比如强海流区、温跃层、涡旋核心区等,大幅提升关键区域的预报精度。
2.自适应层归一化的区域适配机制
模块引入自适应层归一化机制,将时空上下文特征动态融入归一化参数调整过程,使模型在不同纬度、不同深度、不同季节的海洋环境中,均可保持稳定的特征表达,有效缓解热带与寒带、表层与深层海洋动力学差异带来的建模困难。
3.跳跃连接的细粒度空间细节保留策略
模块采用编码器-解码器结构,解码器通过转置卷积将低分辨率预测特征,逐步恢复至原始高分辨率网格;同时在编码器与对应解码器层之间建立跳跃连接,将编码阶段的浅层细粒度特征直接传递至解码阶段,避免下采样与预测过程中丢失涡旋、锋面等小尺度海洋结构的空间细节。
》》(四)Mixture-of-Time(MoT)时间混合核心模块
1.海洋变量多时间尺度差异的核心问题适配
不同海洋变量、不同深度层的演化速度存在数量级差异:表层海温具备显著的昼夜周期,变化速度快;深层海流与盐度结构演化缓慢,依赖更长时间尺度的历史信息。单一时间窗口的建模逻辑,无法同时适配所有变量的时间尺度特性,MoT模块针对这一核心问题进行专属设计。
2.通道级可靠性权重的动态学习机制
(1)模块以通道为最小单位进行权重分配,每一个通道对应一个物理量与一个深度层的组合。模块维护专属的可靠性矩阵,记录每一类变量在不同历史时间窗口下的预报误差水平,以此量化不同时间窗口的预报可信度。
(2)训练过程中,模块根据实时预报误差,通过动量更新机制持续优化可靠性权重,使模型逐步学会为快速变化的表层变量选择短时序上下文,为稳定的深层变量选择长时序上下文,实现变量专属的时间依赖建模。
3.多时序分支的最优信息融合策略
模块对来自不同历史时刻的预测分支,基于可靠性权重进行自适应筛选与加权融合,保留预报可信度最高的时序信息,过滤误差较大的分支输出。这种融合方式,使模型可针对不同变量动态选择最优的时序上下文,无需增加模型复杂度即可大幅提升预报精度。
4.自回归误差累积的抑制机制
在滚动预报过程中,MoT模块可动态调整对不同历史时刻预报结果的依赖权重,避免早期迭代产生的误差持续累积并主导后续预报结果,显著延长有效预报时长,提升多步滚动预报的稳定性与一致性。
四、训练体系与优化策略
》》(一)纬度加权的损失函数设计
1.球面网格投影的权重适配逻辑
地球为球形表面,传统等权重损失函数在将球面网格投影为平面矩形网格时,会过度放大高纬度区域的误差权重,导致低纬度关键海域的误差被低估。该系统采用纬度加权损失函数,基于纬度余弦值对不同区域的误差进行动态加权,使模型在全球范围内保持均衡的优化目标,重点提升热带、副热带、赤道海域等关键区域的预报精度。
2.异常值鲁棒的损失函数特性
损失函数采用Charbonnier损失形式,对再分析数据中的异常值具备极强的鲁棒性,可避免模型对局部异常观测点过拟合,在包含噪声的训练数据中,稳定学习海洋系统的真实演化规律。
》》(二)两阶段递进式训练机制
1.单步预报预训练的基础能力构建
第一阶段采用单步预报目标进行预训练,让模型快速学习海洋状态六小时尺度的短时演变规律,建立稳定的特征提取能力与基础预测能力,为后续多步训练提供优质的初始参数,加快整体收敛速度。
2.多步滚动微调的长期稳定性优化
第二阶段引入多步滚动损失,对连续多步的滚动预报结果同步施加约束。该机制强制模型在预测过程中,兼顾未来多时刻的预报一致性,从训练阶段抑制误差在滚动过程中的快速增长,显著提升中长期预报的稳定性与精度。
》》(三)优化器与学习率调度策略
系统采用AdamW优化器,配合余弦退火学习率调度策略。训练初期使用较高的学习率,实现模型参数的快速收敛;训练后期逐步降低学习率,完成模型参数的精细调优。该组合在大规模海洋时空数据的训练中,表现出极强的稳定性与收敛效率,可在有限迭代次数内达到最优预报性能。
》》(四)物理一致性约束的训练策略
训练全过程对所有输入与输出变量施加海陆掩码约束,确保模型仅在海洋格点上进行特征学习与预报输出,陆地区域保持无效值,避免引入非物理的干扰信息,保证预报场的物理一致性与合理性。
五、实验验证体系与性能解析
》》(一)数据集构建与验证体系设计
1.训练与测试数据集构建
系统采用HYCOM全球海洋再分析数据完成训练与测试,该数据是全球少数公开的六小时分辨率海洋再分析产品,具备1/12°空间分辨率与多层垂直结构,覆盖海面至5000米深度,可满足高分辨率模型的训练需求。
(1)训练集覆盖2006年1月至2014年6月,总时长约8.5年,远低于同类模型常用的十几年训练数据量。
(2)验证集采用2014年7月至12月的数据,用于模型超参数调优与过拟合监控。
(3)测试集采用2015年全年的独立数据,用于评估模型的泛化能力与预报性能。
2.实际观测验证体系
采用国际通用的GODAE OceanView IV-TT海洋预报验证框架,基于全球漂流浮标、卫星遥感、Argo剖面等实际观测数据,完成模型真实场景下的性能验证。验证过程中对异常观测值进行严格过滤,剔除偏离物理规律的离群点,同时将不规则分布的观测数据插值至模型网格,实现预报结果与观测数据的点对点公平对比。
3.核心评估指标
采用纬度加权均方根误差作为核心评估指标,该指标充分考虑不同纬度格点的面积差异,可真实反映模型全球预报的整体性能。同时结合误差空间分布、垂直分布、随预报时长的演化规律等多维度分析,全面评估模型的综合性能。
》》(二)全球空间预报性能解析

图 2:海表变量全球均方根误差(RMSE)分布
1.海表温度预报性能
六小时时效的海表温度预报,在热带与副热带海域的误差普遍低于0.3℃,表现出极强的稳定性。误差主要集中在湾流、黑潮、南极绕极流等西部边界流区域,这类区域中尺度涡旋活动强烈、动力过程复杂,是全球海洋预报的公认难点,即便在此类区域,模型仍可保持业务化应用可接受的误差范围。
2.盐度预报性能
盐度预报的空间误差分布与海表温度相似,在河口、强降水区、极地融冰区等淡水通量变化剧烈的区域,误差略有上升,完全符合海洋物理规律。赤道太平洋海域的盐度预报,在所有预报时效下均保持极高精度,体现出模型对热带海洋过程的强表征能力。
3.海流预报性能
短时效下,海流纬向与经向分量的误差空间分布高度一致;随预报时长增加,赤道区域两个分量的误差出现显著差异,与南北半球海流旋转方向不同的物理特征完全吻合。西部边界流区域的海流预报误差略高,但整体保持稳定,无异常增长。
》》(三)全深度垂直预报性能解析
1.全深度预报稳定性
模型在0至1500米的全深度范围内,保持连续稳定的预报能力,预报误差随深度增加缓慢上升,无突变层或异常恶化层。深层海洋的预报误差增长平缓,证实MoT模块可有效适配深层海洋缓慢变化的动力学特性。
2.温跃层预报性能
温跃层位于100米至300米深度区间,是海水温度、密度、海流变化最剧烈的区域,预报难度极高。模型在该深度区间的误差略有上升,但仍保持在业务化应用可接受的范围,证明模型可精准捕捉温跃层的垂直结构与动态演化规律。
3.多层误差演化一致性
不同预报时效下,各深度层的误差增长趋势高度一致,无单一深度层出现显著的性能恶化,说明模型在垂直方向上的建模均衡,可同时适配表层、次表层、中层海洋的不同时间尺度动力学过程。
》》(四)与主流业务化系统的对比验证
在海表温度预报任务中,与国际主流业务化数值模式HYCOM、BLK、FOAM的直接对比结果显示,在相同的验证框架下,该系统的预报误差显著低于对比的传统数值模式,且误差随预报时长的增长速度更慢。
值得注意的是,模型的训练数据仅截至2014年,而观测验证数据来自2022年,时间跨度长达8年,模型仍可实现优于传统数值模式的预报性能,证实模型学习到的海洋演化规律具备高度的普适性,而非对训练样本的简单记忆。
》》(五)消融实验与创新点有效性验证

图 3:基于 HYCOM 再分析数据的不同方法消融实验
1.移除MoT模块的性能变化
移除MoT模块后,海水温度、盐度、海表高度的预报误差出现显著上升,最大增幅接近40%,其中短时效预报的性能下降最为明显,证实MoT模块对高频快速海洋过程的建模至关重要,是系统核心性能的核心支撑。
2.缩减历史输入时刻的性能变化
将历史输入从4个时刻缩减至2个时刻后,模型在长时效预报中的性能出现明显下降,说明足够长度的时序上下文,对捕捉海洋昼夜周期与惯性振荡过程不可或缺。
3.不同变量的敏感度差异
海流分量对MoT模块与历史输入长度的敏感度,显著低于温盐变量,这一现象与海洋物理规律完全吻合——表层海流主要受瞬时风场与地转平衡控制,对历史状态的依赖较弱。该结果为后续多分支专用模型的设计,提供了重要的理论参考。
六、技术优势与落地应用场景
》》(一)核心技术竞争优势
1.亚日级高频预报的能力突破
实现全球首个六小时分辨率的数据驱动海洋预报,可完整捕捉海洋昼夜变化、惯性振荡、潮流变化、短时锋生锋消等快速过程,填补了数据驱动模型在亚日级高频预报领域的技术空白。
2.全深度涡旋解析的精细化建模能力
1/12°的涡旋解析空间分辨率,配合0至1500米的深度覆盖,使模型可同时支撑从表层到中层海洋的三维结构分析,全面满足海洋科研、工程、应急等多场景的精细化需求。
3.极致的计算效率与部署门槛优势
模型推理速度远超传统数值模式,可在普通GPU设备上完成全球实时预报,无需依赖超级计算平台,大幅降低海洋预报的业务化运行门槛。
4.高数据效率与低外部依赖特性
仅需8.5年的再分析数据即可完成训练,数据需求量远低于同类模型;同时不依赖大气强迫场输入,大幅降低外部数据依赖与预处理成本,提升系统的独立性与鲁棒性。
》》(二)核心落地应用场景
1.海上应急救援与突发环境事件处置
六小时高频海流与温盐预报,可大幅提升海上漂流目标的轨迹预测精度,缩短搜救响应时间,提高遇险人员生还率;同时可为溢油、危化品泄漏等突发海洋环境事件,提供精准的扩散路径预报,支撑应急处置方案的快速制定与优化。
2.远洋航运与海上能源工程安全保障
高频高分辨率的海洋预报产品,可帮助远洋船舶精准规避强涡旋、极端海况,优化航行路线,降低燃油消耗与航行风险;同时可为海上风电、深海油气平台的建设与运维,提供全深度的海洋环境预报,支撑施工窗口选择与结构安全设计。
3.渔业资源管理与海洋生态保护
精准的温盐、流场预报,可有效分析鱼类洄游路径与聚集区域,支撑渔业资源的限额捕捞与可持续管理;同时可提前识别赤潮、有害藻华爆发的环境条件,为近岸海洋生态保护提供前置预警窗口。
4.海岸带灾害防御与近海管理
高频海洋预报可支撑风暴潮、海岸洪水、近岸侵蚀等海岸带灾害的预警预报,提升沿海地区的灾害防御能力;同时可为近岸海域功能区划、围填海管控、海洋环境容量评估提供精细化的数据支撑。
5.全球海洋与气候科学研究
高分辨率、长时间序列的海洋预报产品,可为中尺度海洋过程、海洋能量传递、物质输运、全球气候变化等基础研究,提供高质量的三维数据支撑,推动海洋科学与气候科学的研究进展。
七、现存局限与未来演进方向
》》(一)当前技术体系的现存局限
1.训练数据的再分析产品依赖问题
模型训练基于数值模式再分析数据,不可避免地继承了再分析数据中的固有偏差,对模型的真实场景预报能力存在一定影响。
2.全海深覆盖的能力缺口
当前模型的最大预报深度为1500米,未覆盖深海与深渊海域,无法支撑全海深的海洋动力学研究与工程应用。
3.长周期预报能力待拓展
模型在10天以内的中短期预报中表现优异,但季节与年际尺度的长期预报能力尚未完成系统验证,对海洋慢变过程的建模能力仍有提升空间。
4.显式物理约束的融入不足
模型以纯数据驱动为主,未显式融入质量守恒、动量守恒、盐度守恒等海洋物理基本定律,在极端海洋事件的预报中,可能出现非物理的预报结果。
》》(二)未来技术演进核心方向
1.全海深预报能力的拓展
将模型的垂直覆盖深度扩展至5000米全海深,构建全球全海深的AI海洋预报模型,支撑深海科研与工程应用。
2.物理守恒定律的显式约束融入
在模型结构与损失函数中,显式加入海洋物理基本守恒定律的约束,提升预报场的物理一致性与极端场景下的预报可信度。
3.小时级超高分辨率预报能力的构建
进一步将预报时间分辨率提升至1小时,支撑潮汐、近岸浪流耦合、海岸带突发灾害等更高频过程的精准预报。
4.多源异构观测数据的融合建模
融合卫星遥感、Argo剖面、船测、浮标等多源异构观测数据,构建弱依赖再分析数据的纯观测驱动模型,降低数值模式偏差的影响。
5.集合预报与不确定性量化体系的完善
构建集合预报体系,输出概率预报产品与预报不确定性区间,为业务化决策提供更全面的参考信息,提升预报结果的应用价值。
八、行业价值与发展总结
》》(一)对海洋预报行业的技术变革价值
FuXi-Ocean的技术突破,证实数据驱动方法可在亚日级、高分辨率、全深度的全球海洋预报中,超越传统业务化数值模式,标志着全球海洋预报行业正式进入AI驱动的全新发展阶段。其轻量化、高效率、高精度、低门槛的技术特性,打破了传统数值模式的超算资源壁垒,推动海洋预报技术的全球普及与普惠。
》》(二)对全球海洋治理与开发的支撑价值
该系统可广泛应用于海上安全、应急处置、资源开发、生态保护、气候研究等多个领域,为全球海洋治理、海洋经济可持续发展、海洋灾害防御提供核心技术支撑。尤其对中小国家与沿海地区,可大幅降低高精度海洋预报的获取门槛,提升全球海洋灾害的整体防御能力。
》》(三)技术发展总结
FuXi-Ocean突破了传统海洋预报的多项核心技术瓶颈,通过MoT时间混合模块、上下文感知特征提取、球面适配训练体系等多项创新,实现了亚日级、涡旋解析、全深度的全球海洋AI预报,在技术指标与实际性能上均达到全球领先水平。随着模型的持续迭代优化、物理约束的不断融入、多源观测数据的深度融合,AI驱动的海洋预报技术,将在全球海洋治理与开发中发挥越来越核心的作用。
文章来源:Qiusheng Huang, Yuan Niu, Xiaohui Zhong, et al. FuXi-Ocean: A Global Ocean Forecasting System with Sub-Daily. arXiv, 2506, 03210 .

夜雨聆风