液态神经网络:一种值得气象AI关注的动态建模思路

卫星云图不是静止的。雷达回波不是静止的。大气状态更不是静止的。

在真实世界里，很多数据都不是一张图片、一个标签、一次判断，而是一段持续变化的过程。云团会发展，风场会调整，强对流会突然增强，传感器信号也会随时间不断波动。

这就带来一个问题：如果 AI 只擅长处理“静态输入”，它能不能真正理解一个动态系统？

液态神经网络，正是从这个问题出发的一类模型。它不是靠单纯堆大参数取胜，而是试图把神经网络放回“动态系统”的框架中，让模型不仅看到输入，还能描述状态如何随时间演化。

01 一句话看懂它

液态神经网络是一种用于连续时间动态建模的 AI 模型，它擅长刻画随时间不断变化的系统状态。

它属于连续时间动态神经网络，也可以看作循环神经网络和神经微分方程思想的一种结合。

普通神经网络更像一条固定流水线：输入进来，层层计算，得到输出。液态神经网络则更像一个带有“内部状态”的动态系统：输入不仅影响最终结果，也会影响模型内部状态变化的速度和路径。

这里的“液态”，不是说模型结构没有边界，也不是说模型权重在推理时会自动重新训练。更准确地说，它指的是网络内部状态的响应方式具有可变性。

神经和突触动力学

在 Liquid Time-constant Networks，也就是 LTC 中，研究者把神经元状态写成连续时间动力系统，并让神经元的有效时间常数随输入和状态变化而变化。[1]

它关心的不只是当前输入是什么，更关心系统状态如何随时间变化。

02 它解决了 AI 里的什么痛点？

液态神经网络的出现，是为了解决 AI 在连续时间动态系统建模中的表达和适应问题。

很多经典神经网络擅长处理静态输入。比如图像分类模型看一张图，文本模型读一段话。但在真实世界里，许多数据是连续变化的：机器人看到的画面在变，传感器信号在变，大气状态也在变。

RNN、LSTM、GRU 等模型已经可以处理序列，但它们通常以离散时间步递推为主。换句话说，它们更像在一帧一帧地看世界。

Neural ODE 引入了连续时间思想，把神经网络和微分方程结合起来。但这类模型往往需要数值微分方程求解器，工程上可能带来额外计算开销。

液态神经网络试图在中间找到一种路径：既保留连续时间动态系统的思想，又让模型具有更灵活的状态响应能力。因此，它最初更接近时序预测、控制、机器人、自动驾驶和传感器流建模，而不是专门为天气预报提出的模型。

03 它的核心机制是什么？

它的核心机制可以概括为：可变时间常数。

时间常数可以简单理解为系统“反应快慢”的尺度。

如果时间常数小，系统反应更快，适合捕捉短期变化。如果时间常数大，系统反应更慢，适合保留长期信息。

传统模型中的状态更新规则通常相对固定。而液态神经网络中，神经元的有效时间常数会随着输入和当前状态变化。也就是说，同一个模型在不同输入条件下，可以表现出不同的动态响应。

这就是“液态”的关键含义。

它不是一个完全固定的状态机，而是一个会根据输入改变内部演化方式的连续时间系统。

ODE 和封闭形式表示中 LTC 的实例化

从结构上看，一个液态神经网络通常可以粗略拆成三部分：

第一，输入编码器。 负责把原始输入转成模型可以处理的特征，比如时间序列、传感器信号、图像特征或多变量数据。

第二，液态核心。 这是模型的关键部分，由液态神经元组成，负责建模状态随时间的变化。

第三，输出解码器。 把液态核心的状态转换为预测、分类、控制信号或其他任务输出。

在 LTC 中，神经元动力学可以看成一类由非线性门控调节的一阶动态系统[1]。后续的 CfC，也就是 Closed-form Continuous-time Neural Networks，则尝试用闭式近似减少复杂数值求解器带来的瓶颈，使连续时间模型更容易扩展和部署[2]。

封闭式连续深度神经架构

这背后有一个非常直观的类比：

LSTM 像是在序列中设计“记住”和“忘记”的门； Transformer 像是在全局范围内寻找相关信息；液态神经网络则像是在问：这个系统现在应该快一点响应，还是慢一点积累？

因此需要注意的是：

液态神经网络不等于权重会自动在线更新。

训练完成后，模型参数通常仍然是固定的。所谓“适应性”，主要来自内部状态和时间常数随输入变化，而不是每来一个新样本就重新反向传播训练一次。

04 它和 RNN、LSTM、Transformer 有什么不同？

为了更直观地理解液态神经网络，可以把它和几类常见模型放在一起看。

模型	核心思想	擅长什么	主要限制
RNN	用隐藏状态逐步传递历史信息	基础序列建模	长依赖困难，离散时间步为主
LSTM / GRU	用门控机制缓解长期依赖问题	时间序列、语音、文本	结构较固定，连续时间建模不够自然
Transformer	用注意力机制建立全局联系	长距离依赖、大规模语言/视觉任务	注意力计算成本高，对连续动态过程不显式
Neural ODE	用微分方程描述连续状态变化	连续时间建模、科学机器学习	常依赖数值求解器
液态神经网络	用可变时间常数描述动态响应	连续时序、控制、传感器流、小型动态模型	训练和工程实现更复杂，气象实证仍有限

不同模型有不同的归纳偏置，也就是“天生更容易学到哪类规律”。

Transformer 擅长全局信息交互。 CNN 擅长局部空间纹理。 GNN 擅长节点和边的关系。液态神经网络的特点，则是更强调连续时间中的状态演化。

所以需要考虑：

当任务本身是一个动态系统时，是否需要一个更懂时间演化的模型？

05 为什么它可能启发气象 AI？

液态神经网络的建模思想，可能对气象 AI 中的连续观测、动态时序建模、边缘智能和可解释性知识发现有启发。

1. 气象数据本质上是动态系统

大气不是静态图像，而是一个连续演变的复杂系统。

风、温度、湿度、气压、云和降水之间存在耦合。一个变量的变化，可能影响另一个变量的演变。局地扰动也可能在一定条件下发展成更大尺度的天气过程。

液态神经网络强调状态随时间变化，这与气象问题在概念上是相通的。

它提醒我们：气象 AI 不应该只学习“某一时刻图像里有什么”，也要学习“这个状态正在往哪里变化”。

2. 卫星、雷达和站点数据都是连续观测流

卫星云图是一帧接一帧到达的。雷达回波是逐时次演变的。自动气象站和探空资料也具有连续观测属性。

这些数据不是孤立样本，而是观测流。

液态神经网络的思路可以启发我们思考：

如何处理不规则时间间隔的观测？
如何让模型对快速变化过程更加敏感？
如何让模型在平稳阶段保持记忆，在突变阶段快速响应？
如何在连续观测中发现状态变化的关键节点？

这些问题，对于短临预报、灾害预警、强对流识别和移动观测系统都很重要。

3. 它对边缘智能有启发

气象观测正在变得越来越分布式。

自动气象站、无人机、浮标、移动雷达、星载传感器，都可能需要在资源受限条件下进行本地智能处理。

液态神经网络相关研究强调紧凑模型、动态响应和可审计控制。例如 Neural Circuit Policies 研究就关注紧凑神经控制器和可审计自主系统。[3]

这对气象边缘智能有启发：未来某些观测设备也许不只是采集数据，还可以在本地完成初步识别、质量控制、异常检测和风险触发。

4. 它对可解释性知识发现有启发

气象 AI 很难只依赖黑箱模型。预报员和业务系统不仅关心“模型输出了什么”，也关心“模型为什么这样判断”。

液态神经网络基于动态系统建模，内部状态随时间演化具有一定可追踪性。这为分析模型在不同输入条件下的响应方式提供了可能。

当然，这并不意味着液态神经网络天然完全可解释。更准确地说，它提供了一种更适合追踪动态状态的结构基础。

对于气象 AI 来说，这可能帮助我们观察：

哪些时段模型状态变化最剧烈？
哪些输入扰动会触发模型快速响应？
哪些变量变化可能对应预报风险信号？
模型是否在关键天气过程中捕捉到了合理的动态线索？

这些都可以被视为“可解释性知识发现”的潜在方向。

06 已有案例能说明什么？不能说明什么？

液态神经网络已有一些代表性应用案例，但需要谨慎理解。

在无人机视觉导航任务中，Science Robotics 2023 的研究展示了液态神经网络在分布外环境下完成视觉导航任务的能力[4] 。这说明连续时间神经模型在动态控制和未知环境适应方面具有潜力。

但这并不能直接推出：

液态神经网络已经可以成熟用于天气预报。

无人机导航和气象预报是完全不同的问题。

无人机任务关注的是控制决策、视觉输入和环境适应。气象预报关注的是大尺度物理过程、多变量耦合、数值稳定性、极端事件、长期外推和业务可靠性。

液态神经网络在动态环境和连续时序建模方面的研究，为气象 AI 提供了值得借鉴的模型思想；但它是否适合具体气象任务，需要专门实验验证。

07 它的价值和局限是什么？

价值

液态神经网络的价值在于，它提供了一种面向动态系统的 AI 建模思路。

第一，它让我们重新理解时序数据。时序数据不是一串孤立样本，而是一个状态连续演化的过程。

第二，它提供了动态响应机制。模型可以根据输入和当前状态改变响应方式，而不是始终使用固定节奏处理信息。

第三，它对小型模型和边缘智能有启发。在一些控制和时序任务中，液态神经网络相关研究强调紧凑结构和参数效率。这对资源受限设备具有吸引力。

第四，它为可解释性提供了一个入口。由于模型具有显式动态系统结构，研究者可以尝试观察状态轨迹、时间响应和输入扰动对模型行为的影响。

因此它提供了一个视角：

把气象 AI 看成动态系统建模问题，而不仅是图像识别或序列预测问题。

局限

但液态神经网络也有明显局限。

第一，它不是万能模型。它不适合被简单包装成“下一代通用神经网络”，也不能认为它在所有任务上都优于 Transformer、LSTM 或其他模型。

第二，它不是为气象预报专门提出的模型。目前代表性实证更多集中在时序预测、控制、机器人和导航等方向。气象任务需要单独验证。

第三，原始 LTC 涉及连续时间微分方程和数值求解器。这会带来训练复杂度、求解器选择、稳定性和部署成本等问题。CfC 的提出正是为了缓解这一瓶颈。[2]

第四，气象数据的难度远高于一般时序任务。天气和气候系统涉及大规模网格场、多变量耦合、物理守恒、地形影响、观测误差、极端样本稀少以及长期外推不确定性。

第五，可解释性不能被夸大。液态神经网络的状态更容易追踪，并不等于它天然透明。真正用于业务，仍然需要诊断工具、对比实验和物理一致性检验。

因此，理性判断应该是：

液态神经网络的价值在于，它提供了一种面向连续变化环境的建模思路；但如果要进入气象 AI，还需要解决数据尺度、物理约束、长期稳定性、极端天气验证和业务可靠性等问题。

结语

如果说 Transformer 让 AI 学会了在全局范围内寻找联系，那么液态神经网络则提醒我们：AI 还需要学会理解变化本身。

液态神经网络的启发在于：面对持续变化的天空，AI 不应该只是静态识别图像，也应该学会建模时间中的流动。

真正有价值的气象 AI，不只是看见天空，更要理解天空如何变化。

参考论文与资料

[1] Ramin Hasani, Mathias Lechner, Alexander Amini, Daniela Rus, Radu Grosu. Liquid Time-constant Networks. Proceedings of the AAAI Conference on Artificial Intelligence, 2021.

[2] Ramin Hasani, Mathias Lechner, Alexander Amini, Lucas Liebenwein, Aaron Ray, Max Tschaikowski, Gerald Teschl, Daniela Rus. Closed-form Continuous-time Neural Networks. Nature Machine Intelligence, 2022.

[3] Mathias Lechner, Ramin Hasani, Alexander Amini, Thomas A. Henzinger, Daniela Rus, Radu Grosu. Neural Circuit Policies Enabling Auditable Autonomy. Nature Machine Intelligence, 2020.

[4] Makram Chahine et al. Robust Flight Navigation Out of Distribution with Liquid Neural Networks. Science Robotics, 2023.

[5] Ricky T. Q. Chen, Yulia Rubanova, Jesse Bettencourt, David Duvenaud. Neural Ordinary Differential Equations. NeurIPS, 2018.