气象人学AI,到底卡在哪儿?

这些年，经常有同行问我一个问题：气象人到底应该怎么学AI？

问的人很多，有刚毕业的学生，有业务单位的预报员，也有做了很多年科研的老师。大家的背景不一样，但困惑其实差不多。

一部分人是不知道AI到底是什么。Transformer、大模型、扩散模型、智能体，这些词天天看见，但真要解释清楚，又总觉得隔着一层雾。

另一部分人是知道AI很重要，也知道未来绕不开它，但一到实际应用就犯难。数据怎么处理？模型怎么训练？结果怎么评估？最后又怎么部署到业务系统里？

说来也巧，这两个问题，其实也是我自己经常踩的坑。

最开始接触AI的时候，我和很多气象同行一样，看论文像看天书，看公式像看密码本，看代码更像在参加一场没有答案的阅读理解。

后来好不容易把理论看懂一点，新的问题又来了：环境配不好，代码跑不通，模型训练到一半崩掉，部署到业务系统里又是一堆新坑。

更要命的是，这些坑当时好不容易爬出来了，过一阵子又忘了。等下次再遇到，还是熟悉的报错，还是熟悉的绝望。

于是我开始写公众号，把遇到的问题、解决的方法，以及各种奇奇怪怪的坑都记录下来，当作自己的科研备忘录。

一开始目标特别朴素：以后再遇到同样的问题，直接搜自己的公众号，总比在电脑里翻几十个文件夹靠谱。

做科研的人应该都懂这种痛苦：明明记得自己写过某个程序，也记得它解决过什么问题，但等真正要用的时候，却怎么也想不起它到底放在哪个文件里。

这种情况倒也不是因为文件管理混乱。大多数时候，我们还是会认真给文件起名字的。

比如计算时间处理的程序会叫 cal_time.py，计算统计量的会叫 cal_statistics.py；不同技术路线也会按照模型命名，比如 unet.py、cnn.py、transformer.py 之类。

这些文件名确实能告诉我们：这个程序大概是干什么的。

但问题在于，很多真正有价值的东西，其实藏在代码细节里。

比如如何不用写循环直接计算相关系数，如何处理时间对齐问题，如何实现空间插值，如何把模式数据和观测数据精确匹配，甚至某个困扰你好几天的 bug 到底是怎么解决的。

当某一天突然需要其中一段代码时，往往只记得“我以前肯定写过”，却完全想不起来它到底藏在哪个文件里。

于是就开始对疑似文件进行地毯式搜索打开，最后翻了半天才发现，眼睛都看瞎了，才在某个根本想不到的脚本里，找到那段苦思冥想三天才写出来的代码TAT

当然，这还不是最惨的，最惨的是，眼睛都看瞎了，还是没找到。。。

后来我慢慢发现，代码其实还不是最容易丢的东西。真正容易消失的，反而是那些解决问题时积累下来的经验和思路。

比如某个环境为什么必须固定版本，某个模型为什么训练到一半会崩溃，某个部署方案为什么最后被放弃，这些东西当时都懂，半年后又像重新开荒。

于是“阿宗的科研备忘”就这样一点点写了起来。从最开始的代码片段，到后来的模型训练、业务部署、国产GPU、短临预报、模式后处理、大模型和智能体。

写着写着，内容越来越多，问题越来越杂，坑也越填越深。有时候我自己翻以前的文章，都会感慨一句：原来这个坑我早就踩过，还爬出来过，但是我现在居然毫无印象。

再后来，我突然意识到，这些内容如果继续零散地放着，当然也能查，但不够系统。它们需要被重新梳理，变成一条更加完整的学习路径。

于是，就有了这套书：《气象人工智能理论基础》和《气象人工智能实战应用》。

如果用一句话概括，这套书其实想解决两个问题：第一，气象人看不懂AI；第二，气象人不知道怎么把AI用起来。

《气象人工智能理论基础》主要解决第一个问题，也就是“AI到底是什么”。它更像是一张地图，帮读者把人工智能的发展脉络、核心概念和关键技术先串起来。

比如机器学习、深度学习、神经网络这些基础概念，到CNN、RNN、Transformer、扩散模型、大模型、智能体，再到GPU计算和模型部署的底层逻辑，书里都尽量讲清楚。

我写这部分内容的时候，一直提醒自己：这不是写给AI科班学生看的，而是写给气象同行看的。大家熟悉天气过程、数值模式和业务流程，但未必熟悉计算机和深度学习。

所以书里尽量少一点故作高深，多一点“人话解释”。能用气象例子说明的，就不用纯数学概念吓人；能用业务场景讲明白的，就尽量不堆术语。

我一直觉得，很多气象同行不是学不会AI，而是不知道该从哪里开始。AI看起来像一座很高的山，但真正难的不是山高，而是入口太乱。

《气象人工智能理论基础》想做的，就是先把入口整理出来。让你知道哪些概念必须懂，哪些技术值得关注，哪些内容暂时可以先放一放。

而《气象人工智能应用实战》解决的是第二个问题：AI到底能干什么，尤其是在气象业务和科研里，到底怎么用。

因为很多时候，理论看懂只是第一步。真正让人崩溃的，是从“我懂了”到“我跑起来了”之间那段漫长距离。

论文看起来很漂亮，代码一跑就报错；模型在论文里效果很好，换成自己的数据就失灵；实验室里跑得通，一部署到业务系统里又开始各种不服水土。

所以这本书更像一个工具箱，关注的是具体问题如何解决。短临外推怎么做，模式后处理怎么做，短期气候预测怎么做，数据集怎么构建，模型怎么训练和部署。

书里也整理了不少实际应用场景，比如雷达回波外推、数值模式订正、气象要素后处理、短期气候预测、AI竞赛案例，以及端到端业务化流程。

这些内容很多都不是从书斋里写出来的，而是从真实实践里一点点摸出来的。换句话说，它们不是“看起来很优雅”的经验，而是“真的踩过坑”的经验。

比如数据预处理这件事，听起来很基础，但真正做过气象AI的人都知道，很多模型最后不是败给网络结构，而是败给数据质量、时间对齐和维度处理。

再比如模型部署，论文里一般写到测试集效果就结束了，但业务上真正麻烦的事情，往往从部署才开始：环境、显存、推理速度、数据接口、异常处理，一个都不能少。

所以《气象人工智能实战应用》并不只是讲“模型怎么搭”，而是尽量把从数据到模型、从实验到业务、从代码到系统的流程完整串起来。

这也是我觉得这套书比较重要的地方。它不是单纯讲AI，也不是单纯讲气象，而是试图搭一座桥，连接气象人熟悉的业务问题和AI方法之间的空白地带。

对气象出身的读者来说，这套书希望帮你跨过两个门槛：先知道AI的基本逻辑，再知道怎么把它放进自己的研究和业务场景里。

你不一定马上成为算法专家，也不一定马上写出一个世界领先模型，但至少再看到Transformer、大模型、物理约束、智能体这些词时，不会只剩下“这啥啊”。

更重要的是，当你面对一个具体气象问题，比如短临预报、模式订正、极端降水识别、业务系统智能化时，可以开始有思路地想：这个问题能不能用AI做？该从哪里入手？

写完这两本书以后，经常有人问我：你觉得人工智能未来会把气象带到哪里？

坦率地说，我不知道准确答案。十年前没人想到今天的大模型，二十年前也没人想到手机会变成现在这样，技术的发展从来不是线性的。

但有一点我越来越确定：AI对气象的意义，绝不只是提高几个评分指标，也不只是节约几小时工作时间。

它真正改变的，是人类理解大气系统、认识天气过程，以及应对自然风险的方式。

过去几千年，人类面对天气，更多依靠观察和经验。后来数值模式出现，我们第一次拥有了系统预测未来天气变化的能力。

而今天，人工智能正在把这种能力继续向前推进。我们开始从被动预测走向主动理解，从事后响应走向提前识别和拆解风险。

关注的不再只是天气会不会发生，而是为什么发生；不再只是灾害来了怎么办，而是如何提前降低它带来的影响。

很多时候我会觉得，未来的预报员也许不再只是传统意义上的预报员，而更像复杂地球系统中的协调者。

AI负责分析海量信息，数值模式负责推演未来变化，而人负责理解、判断和决策。人与机器一起，与复杂的大气系统展开更深入的对话。

所以在开始写书的时候，我就把这些思考放在了第一章，作为对人工智能与气象融合未来的一点展望。

我用了一个有点“豪气”的表达：试比天高。

这里的“试比天高”，当然不是征服自然，更不是和自然简单较量。越研究大气，越会感受到自然规律的复杂与伟大。

真正的“试比天高”，是在敬畏自然的基础上理解规律、利用规律，在科技进步的过程中守护生命、降低灾害风险。

让灾害从不可预测的黑天鹅，逐渐变成能够提前识别和应对的灰犀牛；让极端天气不再只是破坏性的力量，而成为能够被理解和有效应对的自然过程。

回头看最初写公众号的时候，我以为自己只是在记录代码和解决问题的方法。后来才发现，自己记录的是经验，是成长，也是这个行业正在发生的变化。

而当这两本书最终完成时，我忽然明白，我真正想记录的，是人工智能与气象深度融合的未来。

那个属于气象科学新纪元的未来，也许正在一步步向我们走来。而我们每一个人，都恰好站在这个时代变化的门口。

风起于青萍之末，浪成于微澜之间。

未来已来。