乐于分享
好东西不私藏

气象AI大发展

气象AI大发展

点击蓝字
关注我们

2023年7月,华为盘古气象大模型登上Nature,7天全球预报只需1.4秒,速度比传统数值方法快了约1万倍[1]。同年12月,Google DeepMind的GraphCast登上Science,60秒内完成10天全球预报,90%的变量预报技巧超越了欧洲中期天气预报中心(ECMWF)的标杆系统HRES[6]。两篇顶刊论文像两声发令枪,宣告气象预报进入一个全新赛道。此后不到三年,全球涌现数十个AI气象大模型——微软Aurora、NVIDIA Earth-2、中国”风”系列矩阵……AI正在重塑天气预报的每一个环节。但一个核心问题始终悬而未决:AI真的比传统数值预报更准、更可靠吗?

速度碾压:分钟级预报成为常态

AI气象模型的首要突破是速度。盘古的1.4秒7天预报、GraphCast的60秒10天预报,意味着什么?传统数值预报需要超级计算机运行数小时,而AI模型在一台配备GPU的服务器上就能完成。Google 2025年推出的WeatherNext 2更进一步——比前代快8倍,空间分辨率达到1小时,99.9%的预报变量超越前身,并已集成到Google Search、Maps和Vertex AI中[10]

精度也在同步攀升。DeepMind 2024年底发表的GenCast采用扩散模型架构生成概率集合预报,在97.2%的评估指标上超越了ECMWF传统的51成员集合预报系统[7]。微软Aurora则用100万小时地球物理数据训练出一个基础模型,能同时处理热带气旋、海浪、空气质量等多种预报任务[14]

中国的布局同样密集。上海AI实验室的”风乌”将全球中期有效预报时效推至10.75天,其高分辨率版本风乌-GHR达到9km分辨率[6]。“风雷”聚焦临近预报,2024年9月业务化运行,强回波TS评分提升33%,分辨率达到1km/6min[6]。“风顺”是全球首个AI次季节预报业务系统,对 Madden-Julian Oscillation(MJO)的预测时效达到32-36天[6]。再加上复旦大学的”伏羲”——其集合预报版本FuXi-ENS在98.1%的CRPS指标上超越ECMWF-ENS——中国已形成覆盖短临、中短期、延伸期的完整AI气象模型矩阵[6]

业务化的里程碑也在密集落地。ECMWF的AIFS系统于2025年2月正式业务化运行,这是全球主要气象机构首个投入日常业务的AI预报系统[8]。随后NOAA的AIGFS于2025年12月业务化,HGEFS成为全球首个物理+AI混合集合预报系统[6]。德国DWD的AICON-Global也于2026年3月加入这一行列[6]

智能体落地:从”告诉你天气”到”帮你做决定”

模型层面的突破只是前半场。2026年,气象AI开始进入”智能体”(Agent)阶段——不再只是输出一组温度和气压数字,而是直接参与决策流程。

腾讯云2026年3月发布的AGCD框架是个典型样本。它由多个智能体协作运行:有的负责解读模型输出的气象数据,有的负责跨模态解码(将数值转化为文字、图表、预警信息),在盘古等多个底层模型上均实现了预报精度的一致提升[4]。2026年4月发布的”千百炼”气象预报智能体更进一步,构建了规划-执行-反馈的完整链路,用户可以用自然语言提问”未来三天华南地区航班延误风险如何”,智能体自动拆解任务、调用模型、生成分析报告[5]

民航领域的需求尤其迫切。2026年4月推出的民航空管气象智能体,能自动构建气象结论集、实现7×24小时产品质控,将空管人员从繁重的信息筛选中解放出来[9]。阿里云的百炼平台则将门槛拉到极低——借助MCP协议,用户2分钟就能搭建一个专属气象Agent[13]

这种转变的本质是:气象服务从”被动工具调用”走向”主动决策支持”。正如2025年8月《气象》期刊一篇论文所指出的,Manus式多代理联邦架构特别适合气象预报这类需要多源信息融合、多步骤推理的场景[11]

光鲜背后的硬核挑战

但热闹归热闹,AI气象预报并非无懈可击。2026年2月,罗京佳等45位全球气象与AI专家联合发表综述,凝练出三大共识性挑战[2][3]

第一个挑战是”黑箱”难题。深度学习模型的决策过程不透明——它告诉你明天有暴雨,但无法解释为什么。这种不可解释性直接影响了科学可信度,特别是在需要为防灾决策背书的场景下[2]

第二个挑战更深层:物理一致性缺失。AI模型从数据中学习统计规律,但不一定遵守能量守恒、质量守恒等基本物理定律。在常规预报中这问题不大,一旦进入长期模拟或极端外推场景,模型就可能输出”物理上不可能”的结果[3]。Zhang等人2025年的研究证实,AI模型会系统性低估创纪录的极端天气事件——因为这些事件在训练数据中几乎没出现过[6]

第三个挑战是评估体系不完善。不同模型用不同数据集、不同指标进行评测,很难公平比较。高虚警率(62%-97%)也是一个挥之不去的阴影[6]

与此同时,传统数值预报并非束手就擒。数据同化——将观测数据融入初始场的过程——仍占超算50%以上的负载,这一部分目前还是AI难以替代的[6]。这引出了行业内的路线之争:纯数据驱动能否走得通?还是最终必须走向物理+AI的混合架构?

三个趋势

短期来看,三个趋势已经比较清晰。

概率预报成为主流。传统确定性预报给出一个”明天28度”的数字,概率预报则告诉你”明天温度在26-30度之间的概率是80%“。GenCast的扩散模型、FuXi-ENS的集合预报,都在这条路上。这更符合实际决策需求——航空公司、保险公司需要的是风险评估,不是点估计。

开源生态打破垄断。NVIDIA Earth-2在2026年1月发布,成为全球首个完全开放的气象AI全栈,26GB显存的GPU就能运行[14]。ECMWF的Anemoi框架也走开源路线,数据采用CC-BY-4.0协议。对于气象基础设施薄弱的发展中国家,这意味着获取高质量预报服务的门槛大幅降低。

人机协同而非替代。最可能的终局不是AI取代预报员,而是AI处理海量数据和模式识别,人类预报员专注解释、判断和决策。会用AI的预报员将取代不会用的——这句话用在气象领域,可能比任何行业都贴切。

结语

气象AI的大发展,才刚刚开始。GraphCast和盘古打开了大门,GenCast和”风”系列证明了规模化可行性,智能体则让技术真正走向应用。但黑箱、物理一致性、极端天气盲区这些硬骨头,短期内不会自动消失。

这场变革的真正赢家,或许是那些既能理解大气物理、又能驾驭AI工具的”双语者”。技术迭代很快,但天气从来不等人。

参考文献

[1] 华为云. 盘古气象大模型. Nature, 2023. doi:10.1038/s41586-023-06185-3

[2] 罗京佳等. 45位全球专家AI气象综述. 群众网, 2026年2月.

[3] 中国科学技术协会. 全球45位专家共识:AI气象三大挑战, 2026年2月.

[4] 腾讯云. AGCD多智能体气象预报新突破, 2026年3月.

[5] 千百炼科技. 千百炼气象预报智能体, 2026年4月.

[6] Articsledge. AI Weather Forecasting 2026: State of the Industry.

[7] DeepMind. GenCast扩散概率预报模型. Nature, 2024年末.

[8] ECMWF. AIFS业务化运行, 2025年2月

[9] 民航空管气象智能体. 2026年4月.

[10] Neuronad. WeatherNext 2发布, 2025年11月.

[11] 《气象》期刊. 大语言模型在气象预报中的应用, 2025年8月.

[12] 阿里云百炼. MCP快速构建气象Agent.

[13] Ars Technica. Microsoft Aurora AI storm forecasting. Nature, 2024.

[14] NVIDIA. Earth-2开放气象AI全栈, 2026年1月.

[15] National Tribune. 香港科技大学扩散模型强对流预报. PNAS, 2026年1月.

扫码加入读者交流群
备注:姓名+职业+地区
END