这些年,经常有同行问我一个问题:气象人到底应该怎么学AI?
问的人很多,有刚毕业的学生,有业务单位的预报员,也有做了很多年科研的老师。大家的背景不一样,但困惑其实差不多。
一部分人是不知道AI到底是什么。Transformer、大模型、扩散模型、智能体,这些词天天看见,但真要解释清楚,又总觉得隔着一层雾。
另一部分人是知道AI很重要,也知道未来绕不开它,但一到实际应用就犯难。数据怎么处理?模型怎么训练?结果怎么评估?最后又怎么部署到业务系统里?
说来也巧,这两个问题,其实也是我自己经常踩的坑。
最开始接触AI的时候,我和很多气象同行一样,看论文像看天书,看公式像看密码本,看代码更像在参加一场没有答案的阅读理解。
后来好不容易把理论看懂一点,新的问题又来了:环境配不好,代码跑不通,模型训练到一半崩掉,部署到业务系统里又是一堆新坑。
更要命的是,这些坑当时好不容易爬出来了,过一阵子又忘了。等下次再遇到,还是熟悉的报错,还是熟悉的绝望。
于是我开始写公众号,把遇到的问题、解决的方法,以及各种奇奇怪怪的坑都记录下来,当作自己的科研备忘录。
一开始目标特别朴素:以后再遇到同样的问题,直接搜自己的公众号,总比在电脑里翻几十个文件夹靠谱。
做科研的人应该都懂这种痛苦:明明记得自己写过某个程序,也记得它解决过什么问题,但等真正要用的时候,却怎么也想不起它到底放在哪个文件里。
这种情况倒也不是因为文件管理混乱。大多数时候,我们还是会认真给文件起名字的。
比如计算时间处理的程序会叫 cal_time.py,计算统计量的会叫 cal_statistics.py;不同技术路线也会按照模型命名,比如 unet.py、cnn.py、transformer.py 之类。
这些文件名确实能告诉我们:这个程序大概是干什么的。
但问题在于,很多真正有价值的东西,其实藏在代码细节里。
比如如何不用写循环直接计算相关系数,如何处理时间对齐问题,如何实现空间插值,如何把模式数据和观测数据精确匹配,甚至某个困扰你好几天的 bug 到底是怎么解决的。
当某一天突然需要其中一段代码时,往往只记得“我以前肯定写过”,却完全想不起来它到底藏在哪个文件里。
于是就开始对疑似文件进行地毯式搜索打开,最后翻了半天才发现,眼睛都看瞎了,才在某个根本想不到的脚本里,找到那段苦思冥想三天才写出来的代码TAT
当然,这还不是最惨的,最惨的是,眼睛都看瞎了,还是没找到。。。
后来我慢慢发现,代码其实还不是最容易丢的东西。真正容易消失的,反而是那些解决问题时积累下来的经验和思路。
比如某个环境为什么必须固定版本,某个模型为什么训练到一半会崩溃,某个部署方案为什么最后被放弃,这些东西当时都懂,半年后又像重新开荒。
于是“阿宗的科研备忘”就这样一点点写了起来。从最开始的代码片段,到后来的模型训练、业务部署、国产GPU、短临预报、模式后处理、大模型和智能体。
写着写着,内容越来越多,问题越来越杂,坑也越填越深。有时候我自己翻以前的文章,都会感慨一句:原来这个坑我早就踩过,还爬出来过,但是我现在居然毫无印象。
再后来,我突然意识到,这些内容如果继续零散地放着,当然也能查,但不够系统。它们需要被重新梳理,变成一条更加完整的学习路径。
于是,就有了这套书:《气象人工智能理论基础》和《气象人工智能实战应用》。


如果用一句话概括,这套书其实想解决两个问题:第一,气象人看不懂AI;第二,气象人不知道怎么把AI用起来。
《气象人工智能理论基础》主要解决第一个问题,也就是“AI到底是什么”。它更像是一张地图,帮读者把人工智能的发展脉络、核心概念和关键技术先串起来。
比如机器学习、深度学习、神经网络这些基础概念,到CNN、RNN、Transformer、扩散模型、大模型、智能体,再到GPU计算和模型部署的底层逻辑,书里都尽量讲清楚。
我写这部分内容的时候,一直提醒自己:这不是写给AI科班学生看的,而是写给气象同行看的。大家熟悉天气过程、数值模式和业务流程,但未必熟悉计算机和深度学习。
所以书里尽量少一点故作高深,多一点“人话解释”。能用气象例子说明的,就不用纯数学概念吓人;能用业务场景讲明白的,就尽量不堆术语。
我一直觉得,很多气象同行不是学不会AI,而是不知道该从哪里开始。AI看起来像一座很高的山,但真正难的不是山高,而是入口太乱。
《气象人工智能理论基础》想做的,就是先把入口整理出来。让你知道哪些概念必须懂,哪些技术值得关注,哪些内容暂时可以先放一放。
而《气象人工智能应用实战》解决的是第二个问题:AI到底能干什么,尤其是在气象业务和科研里,到底怎么用。
因为很多时候,理论看懂只是第一步。真正让人崩溃的,是从“我懂了”到“我跑起来了”之间那段漫长距离。
论文看起来很漂亮,代码一跑就报错;模型在论文里效果很好,换成自己的数据就失灵;实验室里跑得通,一部署到业务系统里又开始各种不服水土。
所以这本书更像一个工具箱,关注的是具体问题如何解决。短临外推怎么做,模式后处理怎么做,短期气候预测怎么做,数据集怎么构建,模型怎么训练和部署。
书里也整理了不少实际应用场景,比如雷达回波外推、数值模式订正、气象要素后处理、短期气候预测、AI竞赛案例,以及端到端业务化流程。
这些内容很多都不是从书斋里写出来的,而是从真实实践里一点点摸出来的。换句话说,它们不是“看起来很优雅”的经验,而是“真的踩过坑”的经验。
比如数据预处理这件事,听起来很基础,但真正做过气象AI的人都知道,很多模型最后不是败给网络结构,而是败给数据质量、时间对齐和维度处理。
再比如模型部署,论文里一般写到测试集效果就结束了,但业务上真正麻烦的事情,往往从部署才开始:环境、显存、推理速度、数据接口、异常处理,一个都不能少。
所以《气象人工智能实战应用》并不只是讲“模型怎么搭”,而是尽量把从数据到模型、从实验到业务、从代码到系统的流程完整串起来。
这也是我觉得这套书比较重要的地方。它不是单纯讲AI,也不是单纯讲气象,而是试图搭一座桥,连接气象人熟悉的业务问题和AI方法之间的空白地带。
对气象出身的读者来说,这套书希望帮你跨过两个门槛:先知道AI的基本逻辑,再知道怎么把它放进自己的研究和业务场景里。
你不一定马上成为算法专家,也不一定马上写出一个世界领先模型,但至少再看到Transformer、大模型、物理约束、智能体这些词时,不会只剩下“这啥啊”。
更重要的是,当你面对一个具体气象问题,比如短临预报、模式订正、极端降水识别、业务系统智能化时,可以开始有思路地想:这个问题能不能用AI做?该从哪里入手?
写完这两本书以后,经常有人问我:你觉得人工智能未来会把气象带到哪里?
坦率地说,我不知道准确答案。十年前没人想到今天的大模型,二十年前也没人想到手机会变成现在这样,技术的发展从来不是线性的。
但有一点我越来越确定:AI对气象的意义,绝不只是提高几个评分指标,也不只是节约几小时工作时间。
它真正改变的,是人类理解大气系统、认识天气过程,以及应对自然风险的方式。
过去几千年,人类面对天气,更多依靠观察和经验。后来数值模式出现,我们第一次拥有了系统预测未来天气变化的能力。
而今天,人工智能正在把这种能力继续向前推进。我们开始从被动预测走向主动理解,从事后响应走向提前识别和拆解风险。
关注的不再只是天气会不会发生,而是为什么发生;不再只是灾害来了怎么办,而是如何提前降低它带来的影响。
很多时候我会觉得,未来的预报员也许不再只是传统意义上的预报员,而更像复杂地球系统中的协调者。
AI负责分析海量信息,数值模式负责推演未来变化,而人负责理解、判断和决策。人与机器一起,与复杂的大气系统展开更深入的对话。
所以在开始写书的时候,我就把这些思考放在了第一章,作为对人工智能与气象融合未来的一点展望。
我用了一个有点“豪气”的表达:试比天高。
这里的“试比天高”,当然不是征服自然,更不是和自然简单较量。越研究大气,越会感受到自然规律的复杂与伟大。
真正的“试比天高”,是在敬畏自然的基础上理解规律、利用规律,在科技进步的过程中守护生命、降低灾害风险。
让灾害从不可预测的黑天鹅,逐渐变成能够提前识别和应对的灰犀牛;让极端天气不再只是破坏性的力量,而成为能够被理解和有效应对的自然过程。
回头看最初写公众号的时候,我以为自己只是在记录代码和解决问题的方法。后来才发现,自己记录的是经验,是成长,也是这个行业正在发生的变化。
而当这两本书最终完成时,我忽然明白,我真正想记录的,是人工智能与气象深度融合的未来。
那个属于气象科学新纪元的未来,也许正在一步步向我们走来。而我们每一个人,都恰好站在这个时代变化的门口。
风起于青萍之末,浪成于微澜之间。
未来已来。
夜雨聆风