乐于分享
好东西不私藏

专访AI模型训练专家:乌克兰向伙伴提供真实战场数据,对军用AI的发展有何意义?

专访AI模型训练专家:乌克兰向伙伴提供真实战场数据,对军用AI的发展有何意义?

此前我们曾报道过,在3月12日,乌克兰国防部宣布,将向合作伙伴开放用于人工智能(AI)模型训练的真实战场数据。

那么,真实战场数据的价值将如何助力AI模型的训练?近日,人工智能(AI)应用方向的资深专家石永亮接受了《中国航空报》记者的采访。他表示,军用AI一般采用三层训练体系:大量的模拟数据+合成数据增强+真实战场数据校准。尽管真实战场数据看似在第三层训练中才出现,但这部分工作会决定模型最终性能。

石永亮指出,真实战场数据的价值可以归纳为这三点:减少仿真与现实差距、提供罕见战术与环境数据、提升模型的环境适应(即“泛化”)与决策能力。

石永亮表示,如果没有战场真实数据,AI模型仍能通过模拟环境、合成数据、演习数据、以往军事行动的数据等进行模拟场景的设计、参数调试、数据增强来完成训练。但存在几个不可避免的问题,包括训练周期更长,成本和风险显著增加,可靠性更低等。

他解释道,这种可靠性是指实战背景下,尤其是遭遇极端环境、新型战术和干扰因素叠加等情况时,容易出现可靠性降低情况,进而导致军用AI在实战应用中暴露出风险增加、误识别率增加、误伤概率上升等缺陷。从技术角度讲,基于实验室数据训练出的AI模型,在真实场景中验证时通常会不可避免地出现“域偏移”情况,这就是因为训练数据与真实数据之间在数据特征分布上存在着差异。

01
真刀真枪的数据训练让模型更强、更经济

根据对军用AI的研究,石永亮指出,真实的战场数据对AI模型训练效率的提升十分直接,能让模型跳过“实验室仿真-真实场景验证-回炉调优”这样不断试错的环节,直接基于实战验证的特征来训练,让AI模型从一开始就贴合战场环境,后面的试错和调优的环节将被大幅压缩。

同时,因为有了真实的战场数据,也省去了需要投入海量资源来构建“仿真战场”的高成本。一般来说,为了模拟战场的复杂性,需要联合军事专家、AI工程师、数据标注人员等多方人员,耗时数月甚至数年来构建仿真环境、生成合成数据,各方面的成本都极高。

总结来说,真实的战场数据能够大幅降低AI的训练成本、缩短训练周期。同时,这些战场数据还可以用来微调现有数据图像,通过视频生成模型等来可控地生成,大量的更多国别地区、更多场景、更多环境条件(比如,基于采集了晴天乌克兰战场数据来生成雨天的)高保真“类战场”仿真数据,以辅助模型的训练,从而让AI模型对目标的识别能力、决策能力进一步提升,可靠性更高,更具鲁棒性,堪称军用AI部署应用的“加速器”。

02
训练出更小的AI模型,利于无人装备上部署

石永亮形象地介绍道,对AI模型的训练来说,数据就像人类去图书馆里看书学习,“AI模型看的书就是这些数据集”。如果没有真实战场数据,仅仅依托于仿真数据来训练军用AI模型,就需要AI模型刻意学习各种可能的干扰、极端或罕见情况,这就像是学生“上考场”前要背完所有题型、看完所有书、做完所有模拟练习题——因此,AI模型必须做得很大,用强算力和多参数来保证精度。

他比喻道:“有了真实战场数据,就好比是我们在考前获得了考试重点。对于模型的开发和优化工作来说,真实战场数据就像考前老师给学生们划出的‘考点’。这些信息过滤掉了‘垃圾信息’和‘无效特征’,并针对‘考点’进行了强化,从而让AI模型的训练更加有的放矢

也就是说,真实战场数据能够让AI模型在同样精度下,将模型体积缩小50%~90%,甚至是超轻量模型,但同时依旧能拥有极强的真实环境适应能力。而这样的小算力AI模型,极有可能会很快部署在低成本自杀式无人机,以及用第一人称视角(FPV)技术进行操控的无人机上。

俄乌冲突战场上使用最为广泛的自杀式无人机、FPV无人机,被视为AI模型部署的热门候选平台。

03
能够很大程度上推动无人系统的智能化

石永亮表示,AI模型想要在FPV这类小型、微型的平台上部署,要解决的是算力有限、空间紧张、功耗敏感这三大核心难题。如果依托真实战场数据训练出了功能更聚焦、轻量化的小模型,就可以兼顾低功耗、低成本,从而就有了边端(边缘与端侧的统称)部署的可能性。

搭载这样的AI模型,无人系统不仅能够完成目标识别、自动寻获敌方目标、对敌高效一击等任务,还有望获得在GPS拒止环境下的视觉导航能力。

关于军用AI模型在装备上的部署,石永亮从技术角度给出他的理解是:依旧可按照行业惯例大致分为云端和边端部署,即分成云端智能和边端智能。

他表示,自杀式无人机和FPV无人机,都是对算力、功耗、负载都比较敏感的无人设备,是代表性的边端设备。其所能够部署的AI模型是轻量的目标检测、识别模型。代表性的AI模型有卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)、门控循环单元(GRU)等,可辅助无人系统进行实时目标追踪与威胁评估,显著提升无人系统的自主攻击能力。

为这些无人机系统搭载AI模型,可以理解为在这类边端装备上部署了“本地小脑”;而与此对应的,则是云端的“超级大脑”。以大语言模型(LLM)、多模态大语言模型(MLLM)为代表,云端模型可承载大规模、多源数据融合的预测模型,具备情报分析、作战推演与战损评估能力。

石永亮强调,不论是云端智能还是边端智能,真实的战场数据能带来的影响都是全方位的,能够令其相互促进。

04
新一代AI有望成为“可信赖的战场大脑”

石永亮还指出,真实战场数据还有一项重要价值:可为当前处于在研阶段的下一代AI模型即可控世界模型划定出重点的学习方向。

可控世界模型,理论上来说能够预测世界的下一个状态,但其前提是学习物理、时空、因果、物体、环境演化等现实世界规律。有了真实的战场数据,就可让这下一代AI模型更好地学习和理解真实战场世界里的种种规律,从而让它更为严格地按照现实世界、物理规律和“战场规律”,最终实时生成高度逼真的战场数字孪生,来进行长时序的分析、评估、预测、规划和推演等。

他举例道,可控世界模型能够分析和综合评估不同类型弹药对不同目标的毁伤效果、不同机型在任务中的优劣与打击效能,叠加物理规律(如弹道、天气、地形交互、电磁干扰)、多方实体行为(敌我友部队、平民)和不确定性因素等来制定更为合理可行的行动方案,并同步“想象”多种行动后果与应对处置方案等。

石永亮认为,AI技术的飞速发展正推动战争形态转向“算法战争”,可控世界模型有望把AI从“工具”升级为“可信赖的战场大脑”的战略地位,很可能会成为未来大国军事竞争中的关键不对称优势。

05
“生成更多真刀真枪”,实现算法战争的数据闭环

石永亮还与记者分享了其最新的观察。他表示,新一代的AI模型在预测生成能力方面已有了显著的提升。如近期英伟达(NVIDIA)发布的Cosmos系列可控世界模型、WorldLab的空间智能等(国产的类似模型也取得了大幅进展),在场景生成方面展现出前所未有的时空一致性与物理合理性,真实战场数据正成为这些模型的“物理锚点”,为这些生成模型注入真实物理约束与战术逻辑。

他“大胆”预测,新一代的AI模型,或许能够模拟俄乌冲突的战场,生成下一个潜在战场的场景数字资产,作为军用仿真,提前进行大规模的军事推演。而这一推演过程,无疑又将产生新的真刀真枪的实战数据,又可反哺多模态大语言模型的微调,促进多模态大语言模型在战场认知推理方面的垂直应用和提升,从而形成“数据采集—数据生成—仿真推演—模型优化—实战验证”的闭环迭代。

石永亮认为,这样的“数据闭环”将能够为云端模型的情报分析战场走势推演注入“强心剂”。而对于边端智能而言,模拟真实战场数据进行多样化的数据增强,提升端侧模型的鲁棒性与泛化能力,使其在复杂电磁干扰、恶劣气象及伪装欺骗等实战条件下仍保持高精度识别。

在采访的结尾,他感慨道:“如果时间倒回10年前,彼时俄乌战场真实数据的价值并不会令我们感觉到‘恐怖’,因为10年前的技术条件下,战场数据对全方位战场智能化的提升作用是有限的。但AI技术日新月异的今天,这些数据称得上是稀缺和宝贵的,其所带来的影响也无疑将是‘巨大’的

注:本文提到世界模型特指用于2D、3D生成的世界模型,例如,NVIDIA的Cosmos、阿里巴巴的Wan、WorldLab空间智能等,不涉及Dreamer、JEPA等世界模型。

文案:郑宇航

排版:蓝风

编审 | 监制:武晨、王兰

看航空融媒体工作室出品

从苏联理工中心到西方IT业外包重镇,乌克兰软件产业正“战时转型”

乌克兰为何开放战场数据?战略资产独一无二,已被觊觎许久

世界首次,乌克兰将为“合作伙伴”提供真实战场数据训练AI