
2026年4月底,中国民航局密集出台了两份重量级文件——《关于加快民航公共数据资源开发利用的实施意见》和《民航公共数据资源授权运营管理办法(试行)》。说实话,这两份文件的名字看起来有点“专业”,但如果你稍微往深处想一想,就会发现它们背后的意味远不止于此。
民航业每天产生多少数据?一架波音787单次航班就能产生超过半TB的数据,全国每天上万架次航班起降,累积的数据量堪称天文数字。但长久以来,这些数据大多躺在各单位的服务器里“睡大觉”,彼此之间互不相通,更谈不上被真正“用”起来。这种局面,就像家里堆了一屋子好木头,却没人动手做家具——浪费,太浪费了。
那么,这两份新政策到底想干什么?它们对AI产业意味着什么?对航空公司、地方机场和整个AI生态又会带来怎样的连锁反应?我们来好好聊聊。
一、政策到底说了什么?
先说清楚一件事:民航局这次不是简单地喊一句“数据要开放”就完事了。两份文件加在一起,其实是在搭建一套完整的“游戏规则”。
《关于加快民航公共数据资源开发利用的实施意见》的核心逻辑是:把民航公共数据从“沉睡状态”中唤醒,让它们流动起来。这里说的公共数据,包括机场运行数据、航班时刻数据、旅客流量数据、空管数据、安全监管数据等等——这些都是民航系统在运行过程中自然产生、具有公共服务属性的数据。
而《民航公共数据资源授权运营管理办法(试行)》则回答了更关键的问题:谁来运营这些数据?怎么运营?利益怎么分?安全怎么保障?
这套机制设计得相当细致。授权运营的主体需要具备相应资质,运营过程要遵循“原始数据不出域、数据可用不可见”的原则——通俗点说,就是你可以用数据训练模型、开发应用,但你不能直接把原始数据拿走卖掉。这有点像你可以在图书馆里看书做研究,但不能把书撕下来带回家。
更重要的是,政策明确了收益分配机制。用于公共治理、公益事业的公共数据服务,鼓励有条件无偿提供;用于产业发展、行业发展的,可以按照政府指导定价有偿提供,并对数据提供方适当进行成本价值补偿。这个设计很聪明——既避免了数据被“白嫖”,又不至于因为过度商业化而伤害公共利益。
回顾一下政策脉络,会发现这其实是一盘下了很久的棋。早在2022年,民航局就出台了《关于民航大数据建设发展的指导意见》,提出了“1+3+4+N”的总体框架——1部指导意见,3部管理办法,4项管理制度和N部标准。2025年4月,《民航数据管理办法(试行)》和《民航数据共享管理办法(试行)》正式发布,明确了民航数据的分类(公共数据、企业数据、个人信息数据)以及各方职责分工。现在这两份新文件,可以看作是整个数据管理体系在“开发利用”环节的进一步深化。
换句话说,民航局正在做的,不是一次性的“放水”,而是系统性地建设一个“数据水利工程”——修渠道、建水库、定水价、管安全。这个工程一旦建成,数据的价值才能真正流出来。
二、民航公共数据的价值
我们暂且放下政策文本,来聊聊一个更本质的问题:民航数据到底有什么“金贵”的?
回答这个问题,得先理解AI模型训练的“饥饿症”。
今天所有的大模型,无论是GPT、Llama还是文心一言,本质上都是用海量数据“喂”出来的。但问题是,高质量的中文数据正在变得越来越稀缺。有研究预测,到2026年,大模型训练就可能消耗尽所有高质量文本数据。这意味着,谁能掌握更多高质量、高价值的数据,谁就能在AI竞赛中占得先机。
民航数据恰恰满足“高质量数据”的几个关键特征。
第一,民航数据具有极强的结构性和准确性。 航班时刻、旅客信息、行李追踪、安全检查——每一笔数据都必须精确到秒级,容不得半点差错。这种数据比起互联网上爬来的那些“混杂、噪音、错误”的文本数据,质量要高出一个数量级。用民航数据训练出来的AI模型,在准确性、可靠性上会有天然优势。
第二,民航数据覆盖了从“人”到“物”到“流程”的全链条。 一个乘客从购票、值机、安检、登机、飞行、到达、提取行李的全过程,会产生几十个数据节点;一架飞机从起飞前检查、滑行、起飞、巡航、降落、维修,同样有数百个数据采集点。这些数据串联起来,构成了一个极为丰富的“行为图谱”。对于AI模型来说,这就像一个有完整剧情、有细节、有逻辑的“剧本”,远比零散的数据片段更有训练价值。
第三,民航数据具有极高的时效性和动态性。 航班延误、天气变化、空域拥堵、旅客流量波动——这些都是实时变化的数据。训练AI模型最怕的就是“过时数据”,而民航数据恰恰是“鲜活”的。这种动态数据对训练AI的预测能力、实时决策能力,价值不可估量。
某航司数科公司的专家就提到,民航业对高质量数据集的迫切需求,以及众多航空公司既是数据的使用方,也相应产生大量场景数据,与外界链接。这话说得直白一点就是:民航数据不仅自己值钱,它还能和外部数据“化学反应”,产生更大的价值。
举个例子。如果把民航数据与气象数据、交通数据、旅游数据、金融数据打通,能做什么?可以预测航班延误概率并提前调整运力,可以优化机场周边的交通调度,可以根据旅游热点预判航线需求——这些应用场景背后,都依赖高质量的数据作为“燃料”。
民航局信息中心建设的数据中台已经实现了数据资源的高效采集、存储、管理,为各个监管板块提供高质量的数据资源和数据服务。通过数据中台的加工处理,信息中心构建了各种数据模型和算法,并在此基础上输出数据分析预测结果,实现了数据统筹共用、数据决策和智能管理。这套基础设施,正是AI产业可以“借力”的关键。
三、政策落地,谁会真正受益?
政策理念很美好,但真正关键的问题是:落到实地,谁会受益?怎么受益?
视角一:航空公司——从“数据持有者”到“数据经营者”
对航空公司来说,这两份政策带来的最大变化,是它们的数据角色正在发生根本性转变。
过去,航空公司的数据是“内部资产”——用于自己调度航班、管理旅客、优化运营。但数据价值被严重“低估”了。你想想,一家航空公司每年运送数千万旅客,掌握着他们的出行习惯、消费偏好、服务需求——这些数据如果经过脱敏处理、加工成数据产品,可以卖给旅游平台、酒店集团、零售企业、保险公司。
更直接的应用是优化自身运营。以C919的运行优化为例,东航通过收集飞行、运行、天气、旅客体验等方面的数据,从安全保障、效率提升、价值创造和触感感知等全方位不断优化提升。这种基于数据驱动的精细化管理,已经在实践中显示出成效。
但坦白说,目前大多数航空公司的数据处理能力还很有限。南航构建了可支持超90%核心系统的数据底座,构建起10多个高质量数据集,还对42000个小时的舱音数据进行建模处理,打造了智能舱音平台,在超高噪音环境下舱音识别率达到90%。这种投入在行业内算是“顶配”,多数中小航空公司连基本的数据治理都还没做到位。
政策带来的直接利好是:数据共享通道打通了,航空公司不用再“单打独斗”。通过行业数据共享平台,中小航空公司也可以获取到更丰富的运行数据、空管数据、机场数据,从而提升自身的运行效率。同时,授权运营机制也为航空公司提供了“变现”途径——把自己的数据加工成合规的数据产品,通过平台对外提供,获得合理收益。
当然,挑战也不小。数据安全、旅客隐私保护、商业机密保护——这些都是红线。政策明确了“谁管业务、谁管业务数据、谁管数据安全”的原则,意味着航空公司必须建立起更严格的数据安全管理体系。这对管理水平提出了更高要求。
视角二:地方机场——从“交通枢纽”到“数字枢纽”
如果说航空公司的数据是“流动的”,那么机场的数据就是“固定的”——旅客在机场内的活动轨迹、行为模式、消费习惯,这些数据是机场独有的“资产”。
机场的数据价值被严重低估了。一个大型机场每年服务数千万旅客,这些旅客在航站楼里的每一步——从进入停车场到值机、安检、候机、登机——都会产生数据。这些数据不仅可以用来优化机场自身的运行效率,还可以服务于商业运营。比如,根据旅客流量预测优化商铺布局和人员配置,根据安检排队时间动态调整通道开放数量,根据航班延误情况提前调配餐饮住宿资源——这些都是可以直接“算账”的优化。
政策出台后,机场面临的机遇主要有两个。
第一,机场可以更高效地获取外部数据。过去,机场和航空公司之间的数据共享困难重重,互不信任、标准不一、接口不通——这些都是“老大难”问题。广东机场集团的实践是将集团内各企业、各单位所有数据统一入户,让所有数据汇聚到数据库,让业务人员可以进行自主开发,快速共享机场全场景数据,实现对机场数据全量、准确、丰富的高效使用。这种模式如果能在行业层面推广,机场的数据“饥渴”将得到极大缓解。
第二,机场可以成为“数据运营”的重要参与方。政策鼓励授权运营,机场作为公共数据的“源头”,完全可以通过授权运营的方式,把数据交给专业团队开发成数据产品,自己则获得收益分成。这对于依赖“航空性收入”(起降费、停场费等)和“非航收入”(商铺租金、广告等)的传统机场商业模式,是一个全新变量。
但挑战同样存在。机场的数据治理水平参差不齐。有些机场连基本的数据目录都没有建立,数据的采集、存储、清洗、标注都处于“原始状态”。第二十三届民航信息化发展论坛上,与会嘉宾达成的共识是:“能够驱动行业完成转型升级的,并非‘大体量’数据,而是经过有效治理与提炼的‘高质量’数据。”对机场来说,数据治理本身就是一场“补课”。
视角三:AI产业——数据“新矿”带来的新机遇
对AI产业来说,民航数据的开放授权运营,相当于打开了一座“新矿山”。
当前AI产业面临的最大瓶颈之一就是高质量训练数据的匮乏。民航数据覆盖的领域广泛、结构清晰、真实可靠,正好可以填补这个缺口。可以预见的应用场景包括:
智能客服与数字人。 东航已经开始向旅客提供数字人、实体机器人、智能客服等服务。但要真正实现“像真人一样服务”,需要大量的真实服务对话数据作为训练基础。民航旅客服务数据——包括电话录音、在线聊天、投诉记录——经过清洗脱敏后,完全可以用来训练更智能的客服AI。
航班运行优化。 AI可以基于历史航班数据、气象数据、空管数据、机场运行数据,构建预测模型,提前预判航班延误风险,优化航班调度方案。南航推出的航行通告助手可以自动翻译关键飞行信息,帮助飞行员、情报员掌握报文资料,提升阅读体验、快速定位风险点,每周能为3000个国际航班提供翻译支持,翻译成功率达95%。这就是AI在民航领域落地的一个活生生的案例。
安检智能化。 中国民航科学技术研究院在安检领域开展的AI技术应用,AI技术已应用于视频监控、通行管制、人脸识别、智能判图等场景,实现了对多种类禁限带物品的自动识别,减轻人工判图工作量、降低漏判率、加快安检速度。安检数据本身就是高质量的训练数据——有标注、有结果、有反馈,非常适合用来训练计算机视觉模型。
物流与供应链优化。 航空货运的数据链同样丰富——从货主下单、仓储管理、安检、打板、装机、运输、到达、分拣、提货,每个环节都有数据产生。这些数据可以用来训练物流优化的AI模型,提高货运效率。在深圳机场的物流货站里,实时值守的机器狗以及不断堆叠货物的机械臂,大幅提高了货站的运行效率——这些应用的背后,都离不开优质数据支撑。
但是,AI企业想要真正从民航数据中“淘金”,需要跨越几道门槛。一是数据获取的合规性——必须在授权运营框架下,通过合规渠道获取数据,不能“野蛮生长”。二是数据加工的标准化——民航数据的格式、接口、质量标准需要统一,否则数据“拿过来”也“用不了”。三是场景理解能力——民航业务非常复杂,AI企业如果不能理解业务流程和业务逻辑,就无法开发出真正有用的应用。
四、理想与现实之间
政策方向无疑是对的,但从“纸面”到“地面”,还有不少问题需要解决。
首先是数据“不愿意共享”的问题。 数据共享说起来好听,但做起来阻力重重。航空公司担心商业机密泄露,机场担心失去数据控制权,空管部门担心安全问题——这些顾虑不是没有道理。政策的出台提供了制度保障,但要真正建立起“信任”,还需要时间和具体案例来证明“共享带来的收益大于风险”。
其次是“数据质量”的问题。 民航系统虽然整体数据质量相对较高,但不同单位之间的数据标准、格式、质量参差不齐。有的单位数据管理规范,有的则“脏乱差”。如果数据源质量问题不解决,“脏数据”只会“污染”AI模型,产生错误结论。《智慧民航建设路线图》提出要“构建‘标准统一、实时共享、全面覆盖’的行业数据治理体系”——这个目标是正确的,但实现起来需要大量基础工作。
第三是“利益分配”的问题。 数据授权运营必然涉及利益分配。谁贡献了数据?谁开发了产品?谁承担了风险?最终收益怎么分?政策给出了方向性指引——要按照贡献大小分配收益,但具体操作中如何“算清楚”这笔账,还需要在实践中摸索。
第四是“人才与能力”的问题。 数据价值的释放,最终要靠“人”来实现。但多数民航企业的数据人才储备严重不足。民航局在《智慧民航建设路线图》中提出,民航院校要在课程中增加数字化相关内容,但人才缺口不是一朝一夕能补上的。政策的落地,需要配套的人才培养和培训体系。
请在微信客户端打开
写在最后
回到开头的问题:民航公共数据到底能“冶炼”成什么?
我的判断是,这不会是一场“革命”,而会是一场“进化”。数据不会突然之间改变一切,但会一点一点地渗透到民航运行的每一个环节——让航班调度更准一点,让安检更快一点,让行李托运更顺畅一点,让旅客服务更贴心一点。这些看似微小的变化,累积起来,就是质的飞跃。
政策最重要的贡献,不是“给出了答案”,而是“搭建了舞台”。有了明确的数据分类、权责分工、共享机制、授权运营规则,各方参与者才知道自己“该干什么”、“能干什么”、“怎么干”。舞台搭好了,真正的好戏,还是需要航空公司的数据团队、科技企业的算法工程师、机场的运营管理者、监管部门的政策制定者——这些“人”——来共同演绎。
数据是“矿石”,AI是“冶炼炉”,但真正让“矿石”变成“黄金”的,是人的智慧。
这趟旅程,才刚刚开始。
—— END ——
(都看到这里了,还不关注我们吗 ?可以持续获得AI时代的生存指南哦 ↓)
往期回顾:
1. 从“资源不清”到“成本可算”:财政部5号文开启公共数据治理新阶段
夜雨聆风