
0
引言
海表温度(SST)是刻画海洋热力状态的关键物理变量,对海气相互作用、极端气候事件预测、海洋生态系统监测和渔业资源管理具有重要意义。然而,现有数据驱动 SST 预测模型普遍存在两个不足:一是缺乏物理一致性约束,容易产生统计上合理但物理上不合理的预测结果;二是对频域周期信息和多尺度时空特征利用不足,导致多步预测中误差累积明显。
针对这些问题,Liu et al.(2026)提出 PCFNet,一种融合物理约束与频域特征提取的海表温度预测网络。该模型通过空间—时间模块(Spatial–Temporal Module, STM)提取 SST 的时空和频域特征,并设计约束集成模块(Constrained Integration Module, CIM),将平流—扩散方程(Advection–Diffusion Equation, ADE)的物理守恒性质嵌入预测过程,从而提升模型对 SST 动态演化规律的刻画能力。
南海区域日尺度和周尺度实验表明,PCFNet 在预测精度、物理一致性和多步预测稳定性方面均优于 CoTCN、PANN、EarthFarseer、Swin Transformer、PredRNN、ConvLSTM 和 CNN 等模型,为物理先验与数据驱动融合的 SST 预测提供了一个具有解释性的深度学习框架
1
研究背景:为什么海表温度预测如此重要
海表温度是海洋热力状态最直接的表征变量之一,也是连接海洋和大气系统的重要桥梁。它不仅影响海气热量交换、台风增强、季风变化和极端气候事件,也与渔业资源分布、海洋生态系统变化和全球气候演变密切相关。
在全球变暖背景下,准确预测 SST 已经成为物理海洋学、气候科学和遥感智能分析交叉领域的重要问题。
当前 SST 预测方法大致可以分为两类:
数值模拟方法
数值模式通过显式求解海洋动力学和热力学方程来模拟 SST 演化。它们具有较强的物理基础和可解释性,能够较稳定地描述海洋状态变化。
但其局限也很明显:
• 对参数化方案敏感• 计算成本较高• 依赖大量观测数据和复杂数值技术• 在长时间、高分辨率和快速预测场景中部署困难
数据驱动方法
深度学习方法通过历史 SST 数据学习未来变化规律,具有较强的非线性拟合能力。CNN、LSTM、ConvLSTM、PredRNN 和 Transformer 等模型已经被广泛用于 SST 预测。
但纯数据驱动模型通常存在一个关键问题:
它们可以学习统计相关性,却不一定遵守海洋物理规律。
也就是说,模型可能在 RMSE 上表现不错,但预测结果并不符合热量输运、平流扩散或空间梯度结构等真实物理过程。
因此,SST 预测不能只追求“数值拟合”,还需要同时满足“物理合理”
2
核心问题:现有 SST 深度学习模型缺什么?
论文指出,当前 SST 预测模型主要面临两个瓶颈。
物理一致性不足
SST 的时空演化本质上是热量在海洋表层中的输运过程,受到海流平流、湍流扩散、混合和海气交换等因素影响。从物理机制上看,SST 的变化可以用平流—扩散过程描述。
但是,许多深度学习模型只是直接从历史 SST 场预测未来 SST 场,并没有显式约束预测结果是否符合热量守恒和输运动力学规律。
这会导致两个问题:
• 短期预测可能还可以,但长期预测容易误差累积• 预测结果可能在统计上合理,却在物理上不合理
频域特征利用不足
SST 变化不仅存在时间域上的趋势,也包含明显的频域结构。例如:
• 季节性周期• 天气尺度扰动• 季节内振荡• 区域性高频波动• 多尺度海洋过程叠加
传统模型通常侧重时域建模,对频率域中的周期性信息利用不足。而傅里叶变换可以将 SST 信号从时空域映射到频域,从而揭示其隐含周期、趋势和多尺度变化特征。
PCFNet 的核心思想就是:用 FFT 提取 SST 的频域结构,用 ADE 约束 SST 的物理演化过程,让模型既“懂数据”,也“懂物理”。
3
PCFNet 总体框架:数据驱动预测 + 物理约束修正
PCFNet 采用 encoder–decoder 架构,主要由两个核心模块组成:
• STM:Spatial–Temporal Module,空间—时间模块• CIM:Constrained Integration Module,约束集成模块
整体流程可以概括为:
历史 SST 序列输入→ STM 提取空间、时间和频域特征→ 得到数据驱动的初始 SST 预测结果→ CIM 提取物理约束信息→ ADCB 根据 ADE 进行平流—扩散约束修正→ 数据驱动预测与物理约束结果加权融合→ 输出未来 SST 预测序列
其中,日尺度实验使用历史 10 天 SST 预测未来 1–10 天 SST;周尺度实验使用历史 5 周 SST 预测未来 1–5 周 SST。

图 1. PCFNet 模型整体框架,主要包括空间—时间模块(STM)和约束集成模块(CIM)两个关键组成部分。(a)ADCB 的具体结构,利用 ADE 保证预测结果符合物理规律;(b)SIEB 的具体结构,利用 FFT 提取 SST 频域特征。日尺度实验使用历史 10 天 SST 预测未来 1–10 天 SST,周尺度实验使用历史 5 周 SST 预测未来 1–5 周 SST。
4
关键模块一:STM 如何提取 SST 的时空与频域特征?
STM 是 PCFNet 中的数据驱动特征提取部分,负责从历史 SST 序列中学习未来变化所需的时空信息。它主要由两个子模块组成:
• SIEB:Spatial Information Extraction Block,空间信息提取块• TIEB:Temporal Information Extraction Block,时间信息提取块
SIEB:用 FFT 提取空间频域特征
SIEB 首先将输入 SST 场划分为不重叠的空间块,并映射为嵌入向量。不同于完全依赖多头自注意力机制的 Transformer,PCFNet 引入基于傅里叶变换的 token mixing 操作。
傅里叶变换可以将 SST 从空间域映射到频域,使模型更容易识别:
• 大尺度空间背景场• 区域性温度梯度• 长距离空间依赖• 周期性空间结构• 高频局地扰动
相比普通卷积,FFT 能更好捕捉全局信息;相比单纯注意力机制,FFT 对周期结构和频域特征更加敏感。
TIEB:用多尺度卷积 + FFT 捕捉时间变化
TIEB 使用多尺度全卷积结构,在时间维度上同时提取不同尺度的变化特征。
• 大卷积核:捕捉较长时间范围内的整体变化趋势• 小卷积核:捕捉短期波动和局地细节变化
随后,TIEB 将时间特征映射到频域,通过 MLP 调制关键频率成分,再利用 IFFT 重建回时域特征。
这意味着 PCFNet 不只是观察历史 SST 的数值变化,而是进一步学习 SST 序列背后的周期性、趋势性和多尺度波动结构。
5
关键模块二:CIM 如何引入物理约束?
CIM 是 PCFNet 与普通数据驱动模型最重要的区别。它的核心作用是:利用平流—扩散方程对初始 SST 预测结果进行物理约束修正。
CIM 主要包括:
• Decoder:生成数据驱动预测结果• ADCB:Advection–Diffusion Constraint Block,平流—扩散约束块
Decoder:生成初始预测结果
STM 提取到的时空特征首先进入解码器,通过上采样得到数据驱动的初始 SST 预测结果。这个结果可以理解为模型从历史数据中学习得到的“经验预测”。
但仅靠经验预测并不够,因为它可能不满足真实海洋热输运规律。
ADCB:预测速度场和扩散系数
ADCB 会从编码后的时空特征中预测 ADE 所需的两个关键物理量:
• 速度场 w = (u, v):表示海表水平热输运的方向和强度• 扩散系数 D:表示湍流混合和扩散效应
其中,速度场用于描述热量如何被海流搬运,扩散系数用于描述温度梯度如何在混合作用下被平滑。
ADE:约束 SST 的平流—扩散过程
平流—扩散方程描述的是温度场随时间变化、水平输运和扩散混合之间的关系。
简单理解:
• 平流项:海流把热量从一个地方输送到另一个地方• 扩散项:湍流和混合使温度差异逐渐扩散• 时间项:SST 随时间的变化趋势
ADCB 将预测得到的速度场和扩散系数代入 ADE,并计算物理约束结果,使模型的输出更符合海洋热输运规律。
数据驱动结果与物理约束结果加权融合
最终预测结果由两部分组成:
• 数据驱动预测结果 Xf• 物理约束修正结果 Xp
二者通过权重 λ 进行加权融合。论文在消融实验中发现,当 λ = 0.3 时,1–10 天平均 RMSE 最低。
这说明物理约束不是越强越好,而是需要与数据驱动预测保持适度平衡。PCFNet 的思路不是用物理方程完全替代神经网络,而是采用“数据主导 + 物理校正”的混合建模策略
6
研究区域与数据:南海区域 NOAA OISST 数据集
论文以南海区域作为实验区,仅使用 SST 一个变量进行时空预测。
数据来源
实验数据来自 NOAA Physical Sciences Laboratory 提供的 high-resolution global SST v2.1 数据集。该数据集基于最优插值算法,融合多源卫星观测和现场测量数据,提供连续、高精度的全球 SST 信息。
空间范围
研究区域为南海子区域,空间范围为:
• 经度:106.625°E–122.625°E• 纬度:6.375°N–22.375°N• 空间网格:64 × 64• 空间分辨率:0.25° × 0.25°
时间范围与样本量
日均 SST 数据:
• 时间范围:1981 年 9 月 1 日至 2025 年 2 月 16 日• 样本量:15,876 个日尺度样本
周均 SST 数据:
• 时间范围:1981 年 9 月 1 日至 2025 年 2 月 16 日• 样本量:2,267 个周尺度样本
数据划分
为了保证时间序列预测的严谨性,论文按照时间顺序划分训练集、验证集和测试集,不进行随机打乱:
训练集:1981 年 9 月 1 日至 2016 年 12 月 31 日
验证集:2017 年 1 月 1 日至 2020 年 12 月 31 日测试集:2021 年 1 月 1 日至 2025 年 2 月 16 日
7
实验设置与评价指标
论文将 PCFNet 与多个代表性 SST 预测模型进行比较,包括:CNN、ConvLSTM、PredRNN、Swin Transformer、EarthFarseer、PANN、CoTCN
所有模型使用相同训练集、验证集和测试集,以保证公平对比。
训练设置
框架:PyTorch 1.10.1、Python:3.9、硬件:Intel Core i9-13900K + 双卡 4090D GPU、优化器:Adam、初始学习率:0.001、Batch size:32、训练轮数:200 epochs、输入序列长度:10、预测序列长度:10
评价指标
论文使用三个指标评价 SST 预测性能:
• RMSE:均方根误差,越小越好• MAE:平均绝对误差,越小越好• R²:决定系数,越大越好
这些指标分别从误差幅度、平均偏差和整体解释能力角度评价模型预测能力
8
模型性能:日尺度和周尺度预测均最优
日尺度预测:1–10 天均表现最好
在日尺度实验中,PCFNet 使用历史 10 天 SST 预测未来 1–10 天 SST。
随着预测天数增加,所有模型的 RMSE 和 MAE 都逐渐升高,R² 逐渐下降。这说明多步时间序列预测中的误差累积是普遍现象。
但 PCFNet 在 1–10 天所有预测步长上均取得最优性能。
论文指出,在 1 天预测任务中,与 CoTCN 相比,PCFNet:
• RMSE 降低 2.9%• MAE 降低 5.1%• R² 从 0.982 提升到 0.983
与 CNN 相比,PCFNet 的提升更加明显:
• RMSE 降低 47.0%• MAE 降低 51.5%• R² 从 0.939 提升到 0.961
这说明 PCFNet 不仅比传统 CNN 更强,也能进一步超越较先进的 Transformer 和频域模型。

图 4. 从 2024 年 12 月 18 日开始,未来 1–10 天日尺度 SST 预测结果与对应真实值的比较。说明:该图直观展示了 PCFNet 与其他模型在南海区域的日尺度 SST 空间预测效果。相比其他模型,PCFNet 在整体温度分布和局部细节上都更接近真实值。
周尺度预测:1–5 周仍保持领先
周尺度预测比日尺度更难,因为预测时间跨度更长,误差累积更加明显。
在 1–5 周预测任务中,PCFNet 依然取得最优结果。其中,在 1 周预测中,PCFNet 获得:
• RMSE:0.612• MAE:0.501• R²:0.909
相比 CoTCN:
• RMSE 降低 0.5%• MAE 降低 3.8%• R² 从 0.902 提升到 0.909
相比 CNN:
• RMSE 降低 22.0%• MAE 降低 25.0%• R² 从 0.839 提升到 0.909
这说明 PCFNet 的优势不仅体现在短期预测中,也体现在更长时间尺度的 SST 演化预测中。

图 5. 从 2024 年 12 月 17 日开始,未来 1–5 周周尺度 SST 预测结果与对应真实值的比较。 该图展示了不同模型在周尺度长期预测中的表现。虽然周尺度预测误差整体更大,但 PCFNet 在 1–5 周预测中仍能较好保持南海 SST 的空间结构和温度梯度
9
消融实验:FFT 和 ADE 物理约束到底有没有用?
为了验证关键模块的有效性,论文设计了三个模型变体:
• w/o ADCB:去除平流—扩散约束块• w/o FFT:去除 FFT 频域特征提取,并用 Swin Transformer 替代• w/o ADCB & FFT:同时去除 ADCB 和 FFT
去除 ADCB:后期预测误差累积更快
当去除 ADCB 后,模型不再显式受到 ADE 物理约束。实验结果显示,模型在后期预测阶段 RMSE 明显升高,误差累积速度更快。
这说明 ADE 的物理约束能够限制预测轨迹发散,使 SST 演化过程更符合海洋热输运连续动力学。
去除 FFT:短期预测精度下降明显
当去除 FFT 后,模型对日尺度变化、天气尺度扰动和高频信号的捕捉能力下降,短期预测精度受到明显影响。
这说明频域特征对 SST 预测非常重要,尤其有助于识别隐含周期模式和高频变化。
同时去除 ADCB 和 FFT:性能最差
当同时去除物理约束和频域建模时,模型性能下降最明显。
这表明:
• FFT 负责从数据中挖掘周期性和频域结构• ADCB 负责从物理层面约束演化过程• 二者具有互补关系
PCFNet 的优势并不来自某一个单独模块,而是来自“频域数据特征 + 物理守恒约束”的协同作用。
10
物理一致性评价:PCFNet 更能保持 SST 梯度结构
除了常规误差指标,论文还从 SST 水平梯度场角度评价模型的物理一致性。
SST 水平梯度场能够反映:
• 温度锋面• 局地高梯度区• 热量输运方向• 空间结构边界• 温度突变区域
论文比较了三类指标:
• 梯度幅值• 角度误差• 残差梯度幅值
结果显示,PCFNet 在梯度幅值分布上与真实值更加一致,能够更好保持细粒度结构和边界变化。在高梯度区域,例如锋面和局地温度剧烈变化区,PCFNet 的重建更加稳定,而其他模型更容易出现过度平滑或结构扭曲。
从梯度方向一致性看,PCFNet 的角度误差更低,说明预测的温度输运方向更接近真实情况。从残差梯度幅值看,PCFNet 的整体误差最小,说明其在保持 SST 空间梯度结构方面具有优势。

图 13. 用于物理一致性评价的不同方法 SST 水平梯度场可视化比较。(a)梯度幅值;(b)角度误差;(c)残差梯度幅值。 该图证明 PCFNet 不仅数值预测误差更小,而且更能保持 SST 场的空间梯度、输运方向和局地结构,从物理一致性角度验证了 ADE 约束的有效性
11
对 SST 预测研究的启示
这篇文章对后续 SST 时空预测研究有几个值得借鉴的地方。
物理约束可以作为多步预测的稳定器
在多步 SST 预测中,误差累积是核心难题。PCFNet 表明,将 ADE 这类物理过程嵌入模型后,可以约束预测轨迹,降低长期预测发散风险。
频域特征适合处理周期性海洋过程
SST 具有明显周期变化,包括季节变化、天气尺度扰动和区域性振荡。FFT 能够从频域角度补充时域模型的不足,这对海洋时空预测非常有价值。
物理约束不应完全替代数据驱动
λ = 0.3 的结果说明,物理约束需要适度引入。如果物理参数估计不完全准确,过强物理约束反而可能影响预测精度。
物理一致性评价比单纯误差指标更重要
除了 RMSE、MAE、R²,论文还使用 SST 梯度场评价物理一致性。这一点非常值得借鉴,因为真实海洋预测不仅要数值准确,还要保持锋面、梯度和热输运结构合理
12
结论与展望:物理引导深度学习的 SST 预测新路径
主要科学贡献
提出 PCFNet 海表温度预测网络 将物理约束与频域特征提取融合到 SST 时空预测框架中。
设计 STM 捕捉时空与频域特征 利用 SIEB 和 TIEB 分别提取空间、时间与频域信息,提高模型对多尺度 SST 变化的表达能力。
设计 CIM 嵌入 ADE 物理约束 通过 ADCB 预测速度场和扩散系数,将平流—扩散过程引入预测结果修正。
在日尺度和周尺度预测中均取得最优性能 在南海区域实验中,PCFNet 全面优于 CNN、ConvLSTM、PredRNN、Swin Transformer、EarthFarseer、PANN 和 CoTCN。
从梯度场角度验证物理一致性 PCFNet 能更好保持 SST 空间梯度、方向结构和局地高梯度区域,说明其预测结果更具物理合理性。
未来值得关注的方向
从单变量 SST 预测扩展到多变量海洋预测 融合海表风、盐度、海表热通量、海流等关键驱动因子 将 ADE 约束与不确定性量化结合,评估预测可信度 在台风、上升流、强锋面等极端海洋事件中验证模型鲁棒性 探索 FFT、Mamba、Transformer 与物理约束的进一步融合 构建面向业务化海洋预报的物理引导深度学习框架
13
参考文献
Liu, Y., Xiao, C., Peng, G., Du, W., & Xiao, C. (2026). PCFNet: A Sea Surface Temperature Prediction Network Fusing Physical Constraints With Frequency Domain Feature Extraction. IEEE Transactions on Geoscience and Remote Sensing, 64, 4207615. DOI: 10.1109/TGRS.2026.3694412
夜雨聆风