士兵戴上 AI 眼镜之后,战场先变快三秒

你以为 AI 眼镜是拍照。美军在改的是决策速度。
过去两年,消费级 AI 眼镜的故事很好懂。Meta 的 Ray-Ban 能录像,能问助手,能把手机少掏几次。苹果 Vision Pro 把「显示器搬到脸上」这件事做贵、做重、做进发布会。
我早年创业选的就是 VR/AR 这条赛道。说起来有点愣。第一次在展会上戴 HoloLens,隔空拧一颗虚拟螺丝,在虚拟空间中布置三维模型,晕,但心里觉得终局定了。

后来微软拿下陆军 IVAS大单,行业里人人讲「军用 AR 要对标这一套」。我按那张时间表排过叙事。十年过去,HoloLens 还在找杀手级场景,IVAS 的生产合同没了,新一批样机又要等到 2028 才可能量产。进展慢,慢到你会怀疑当初是不是把发布会 demo 当成了日历。可这篇报道我仍想写完。在坑里待过的人,对「又画了一轮」反而更敏感。
同一时期,另一条线几乎没进中文热搜。
Anduril,估值大约 305 亿美元的那家国防科技公司,和 Meta 一起参与美国陆军 SBMC(Soldier Born Mission Command,士兵自带任务指挥)原型项目。合同 1.59 亿美元,只够买到样机和野外试错。对从业者来说,这笔钱的信号是「陆军愿意同时养多家,而不是再押一家微软」。

更大的一笔在软件。2026 年 3 月陆军宣布,大约 200 亿美元用于把 Anduril 的 Lattice接进全军基础设施。Lattice 可以理解成战场版「数据中台」,把雷达、无人机、电台、指挥所的数据汇到一张图上,再往下发任务。眼镜是士兵眼前的窗口,Lattice 是整套系统的脊柱。
若军用路线跑通,消费级赛道会跟着改评分表。清晰度仍重要,更关键的是眼镜能调度多少 agent(分工的智能体),以及背后接多大的指挥网络。军用会先给出答案,因为一线士兵面对的是生存压力,辅助从「可选」变成「默认开启」。
Anduril 副总裁 Quay Barnett 对 MIT Technology Review 的原话更值得行业档案留存。the human as a weapons system,把人优化成一件武器系统。对做指挥软件、人机交互、军用 AI 的从业者,这句话等于把需求文档写在了封面。
上一副「未来头盔」差点烧掉 220 亿美元。新剧本是三家赛马。
先把冷水泼上。
上一版明星项目叫 IVAS(Integrated Visual Augmentation System,集成视觉增强系统),微软牵头,生产合同一度写到 220 亿美元。2022 年国防部审计(DODIG-2022-085)认定陆军测试不充分就准备量产,存在巨额浪费风险。2025 年 1 月生产大单取消。
对我个人,那次取消不只是一条新闻。它抽掉了创业头几年最硬的一根支柱。我们当时真信过「头盔+战场图层」会在五年内铺开,信到把 IVAS 写进商业计划书的对标页。后来才明白,对标页写得越漂亮,野外验收往往越难看。
教训写进采购结构里。SBMC 同时签三家做原型,Anduril 1.59 亿、Rivet 1.95 亿、Elbit 1.20 亿,合计约 4.74 亿,相对 220 亿是「用零钱买三张彩票」。量产决策推到 2028,零部件 2026 年 3 月才集中到货。做军工电子的同行会懂,这意味着至少还有两到三年窗口,看谁能把样机做成可批量验收的状态。
Barnett 称眼动下单、多步任务在早期样机「跑通过」。离陆军大规模野外测试仍远。报道列的硬门槛对整机厂是实打实的验收项。沙尘、爆炸、烟雾下的可靠性。负重常超 100 磅(约 45 公斤),再加电池与边缘算力。战场没有随处 5G,CV(计算机视觉)和大模型必须 端侧运行。联邦军购还要求零部件供应链与中国厂商脱钩,Meta 商业眼镜那套供货路线不能直接平移。

数字夜视(用传感器加算法增强弱光画面)喊了很多年,常见痛点是延迟高、画面颗粒粗。Anduril 称本轮结合生成式 AI 与传统机器学习有改善。属于工程上说得通、野外仍待证的阶段。
RAND 研究员 Jonathan Wong 当过海军陆战队排长。他反对的是「多占认知带宽」,与反技术无关。他指挥电台时三个频道同时响,两人各说各话,他立刻听不懂任何一句,也更顾不上看周围。
「你能一边看清战场,一边操作这套系统,还让整个班组变得更好吗?」
这条问题直接打在 HMI(人机界面)和产品经理的 KPI 上。眼镜若比电台更吵,士兵会关机。关机之后更糟,后台算法仍在跑,人却退出了 人在回路(human-in-the-loop)。对测试与适航团队,要测的是「关机率」和「误触率」,不能只测实验室里的识别准确率。
问题来了。这副眼镜动的是 OODA,每一格都在变短。
OODA是 John Boyd 提出的对抗框架,观察(Observe)、判断(Orient)、决策(Decide)、行动(Act)。现代作战里常被说成「谁的循环更快,谁占优」。

传统步兵靠肉眼、纸质或平板地图、电台,把「发现目标→请示→打击」走完,往往是分钟级。Anduril 描述的链路是另一套时间尺度。
观察端,头盔或外挂镜片叠加罗盘、战区地图、附近无人机航迹,CV 标出车辆等目标。判断端,LLM(大语言模型)读战场上下文,把士兵口语转成可执行命令。决策端,系统可推荐「派哪架无人机打击」,再交指挥链批准。行动端,Lattice向多平台下发任务。交互上除语音外,还有 眼动追踪和轻触,用来在嘈杂环境里少喊一声。
MIT Technology Review 把此事放在一条更刺眼的产业线上。CV 识别目标,军方早已使用。聊天机器人介入打击决策,在伊朗相关冲突报道里已出现。推荐打击方案并戴上一线步兵眼前的 AR,则把误差距离拉到厘米级视野。
报道里有个对 AI 从业者的细节。Anduril 同时测试 Gemini、Llama、Claude。集成商要处理模型输出不一致、幻觉、延迟差异。而 Anduril 与五角大楼和 Anthropic 的公开冲突刚上过新闻,实测仍包含 Claude。说明「能上杀伤链的模型清单」至今缺乏刚性标准,合同里的责任切分也会长期模糊。
国防部 Directive 3000.09要求致命自主武器保持「适当级别的人类判断」。文件写于 AI 尚以演示为主的年代,默认审批以分钟计。当 OODA 被压到秒级,合规形态往往会变成两类。事前批准一整类目标,AI 在框内自动执行。或 AI 弹出建议,操作员在一到三秒内确认。表格上仍有人在回路,时间尺度上接近盖章。
误差传播同样值得做 FMEA(失效模式分析)的同行细想。一句口语经 LLM 转写,再经 Lattice 分发到多架无人机与火力单元。一次错认、一次幻觉,可在毫秒内变成多平台联动。事后模型厂、集成商、Meta 光学、一线指挥官均可援引合同段落限责。
Anduril 还有自费项目 EagleEye,一体化头盔加显示与夜视,陆军未采购也推进,并计划外销外国军队。路径很直白,用 1.59 亿公款验证技术信誉,用自费版本抬陆军采购预期,用外销摊薄研发、积累多样化战场数据,并在 ITAR(美国防务出口管制)谈判中保留更干净的 IP 切分。做军贸和合规的团队会把 EagleEye 单独建档案,与 SBMC 样机分开估值。
答案在这里。四层堆栈,终端在脸,锁在 Lattice。
把系统拆成四层,便于供应链和软件同行对齐接口。
感知层,数字夜视加目标识别,解决弱光下「先看见」。显示层,Meta 提供 波导(把图像耦进镜片、尽量不挡真实视野的光学方案)和微显示,把符号叠进视野。交互层,语音、眼动、轻触,多模型把自然语言落成命令。决策层,Lattice 汇聚多源数据并编排任务。
若用消费电子类比,眼镜接近「终端」,Lattice 接近「操作系统加应用商店」。手机型号可以换,生态接口若被锁定,换机成本主要在数据与流程迁移。SBMC 三家争的是终端形态,200 亿 Lattice 订单争的是全军数据中枢。对做 C4ISR(指挥、控制、通信、计算机、情报、监视与侦察)软件的从业者,真正要投标的是接口标准、数据 schema、离线同步策略,镜片只是入口。
我仍把它看作 Neuralink 的远房表弟。暂不开颅,先用眼睛和声音外接「看见→下令」回路。神经接口公司会看眼动精度,AR 公司会看波导视场角和功耗,军工集成商会看与现有头盔的机械接口。
军方采购逻辑也在变。IVAS 像「指定总承包、巨额交付、周期长」。SBMC 像 VC组合,小额并行、保留 2028 年选择权。Palmer Luckey 2017 年因政治立场离开 Facebook,创立 Anduril;2026 年 Meta 再为其提供光学。
人物线背后,是特朗普第二任期里,平台公司与五角大楼采购口径的重新对齐。做政企与防务销售的读者,应把 Meta 防务光学线单独列入管线考量,与 Ray-Ban 消费线分开看 P&L。
对中国产业链,三条线要同时读,别只盯「下一个 Ray-Ban」。
供应链。报道写明军用件需重建非中国供应链。反读则确认,光波导、Micro-LED、摄像头模组、整机代工仍大量依托大陆与台湾产能。重建军供链常需三到五年。这段时间里,舜宇、歌尔、立讯等若守住关键工艺,消费级现金流可反哺研发;短板在高端 SoC、军用级可靠性验证与国产化替代节奏。材料与光学工程师的窗口是「别人换供应商时,你能不能成为第二来源」。
场景。中国较少走 EagleEye 式纯军用一体化头盔,但 低空经济、电网巡检、应急指挥、警务消防,与 SBMC 同构,都是「人+无人机+实时图层+语音/手势」。快递员、巡检员、飞手在民用环境排练指挥软件。写低空调度、写工业 AR 的团队,应直接对标 Lattice 的数据融合逻辑,而不是对标 Ray-Ban 的拍照按钮。
规则。美国军用 AI 部署快于国内立法;欧盟 AI Act 对军用有大面积豁免。中国民用侧的算法备案、深度合成标识、治理倡议,在 EagleEye 类系统出现首次重大误击前后,会更像「可出口的制度模板」。做法务、政策研究、国际标准的同行,应跟踪「杀伤链 LLM 责任」是否进入双边谈判文本,而不只盯国内大模型牌照。
资本。美国侧,Anduril 按 VC 期权逻辑烧钱,敢自费 EagleEye。Palantir 市值曾压过洛马,市场在奖励「软件定义国防」。OpenAI 2024 年删除禁止军事用途条款,平台与防务的边界在变薄。
中国侧更值得单独展开,因为钱也在往同一张图上堆。
国家大基金三期总规模约 3440 亿元人民币。名字里带「半导体」,但这一轮明显在往 AI 硬件、先进封装、传感与算力周边外溢。对 AR 眼镜从业者,大基金很少直接投「一副眼镜」,它会投你看不见的那几层,微显示驱动、ISP、低功耗 SoC、先进封装产线。终端厂融不到大基金的钱,照样会被大基金投过的上游卡脖子或救供给。
具身智能是过去两年一级市场最热的篮子之一。智元、宇树、银河通用、傅利叶、众擎,Pre-A 到 B 轮估值跳得很快。人形机器人讲的故事是「在物理世界执行」。军用 AR 讲的故事是「在物理世界看见并下令」。形态差很多,资本模型却共用同一套关键词,多模态感知、端侧推理、任务编排、人机协同、数据飞轮。尽调表里经常出现在同一页「竞品」栏里的,还有商汤、华为的行业 AR 方案,和低空经济的飞控调度平台。
AR 眼镜这边,Rokid、雷鸟、XREAL、闪极、谷东、INMO 等拿的是「终端+场景」的钱。消费级拼佩戴、续航、内容,要么作为头戴显示器,要么作为头戴摄像机,要么作为实时翻译和大模型演示。工业级拼巡检、培训、远程协助。大家争的已不是「能不能显示」,而是「镜片后面接不接得上调度系统」。这和 Lattice 200 亿订单的逻辑同构,只是客户从陆军换成电网、物流、地方应急。
所以你会看到三条钱脉经常拧成一股绳。
大基金托底 供应链与算力。地方引导基金(合肥、苏州、深圳、武汉等)托底 产能、整机与地方场景。市场化 VC 托底 具身智能、空间智能、AR 整机、低空配套。LP 问项目时爱问「你是不是人机融合」。创始人答「是」。评委点头。细问下去,一家在做关节电机,一家在做波导,一家在做飞手眼镜,商业路径完全不同,叙事却落在同一个桶里。
这对从业者既是机会,也是坑。机会在于,上游国产化、场景开放、人才流动,都比十年前 HoloLens 时代宽松。坑在于,资本周期可以比产品周期快很多。IVAS 用 220 亿教育了美国军方。中国这边若把「同赛道」误读成「同质竞争」,容易出现估值先透支、交付后补课。
我吃过这类亏,现在看融资材料会先拆三层。第一层,卖的是终端还是操作系统。第二层,数据谁拥有、能否跨项目复用。第三层,收入来自单点硬件,还是来自调度抽成、订阅、服务。
给投资人和创始人的实操问题,可以收成五句。
谁在扛 军规级或对应级别可靠性验证,还是只在实验室 demo。谁有 可重复的政企订单,而不只是标杆案例。谁能接到 指挥/调度类软件的接口,而不只是卖镜片。具身智能团队做「手」,AR 团队做「眼」,最后会不会被同一家 系统集成商收编。地方引导基金的返投与产能条款,会不会把公司锁死在本地,却够不着全国场景。
美国资本在赌「国防科技 PE 化」。中国资本在赌「人机融合产业化」。Anduril 把眼镜当入口、Lattice 当锁。中国很可能走「多种终端并行、若干调度平台竞争」的路。
大基金、具身、AR 眼镜押的是同一条曲线,但 终局未必是同一个赢家。十年前 VR/AR 的教训是,钱先到,产品未必到。
这一次差别在于,低空、工业、大模型把 付费场景也往前推了一截。场景若成真,叙事就不完全是饼。场景若再次迟到,同赛道会挤成价格战。
我会继续盯 2028 的 SBMC,也会盯国内谁先把「眼+手+调度」拼成可复制的包。那比再听一场「下一代计算平台」发布会,更接近真实进度条。
收尾
Jonathan Wong 说,「必须有效,必须无缝。门槛很高。」我同意门槛高,也同意方向不会在 2026 年掉头。资本、政治意志、士兵训练预算都在加码。
只是不会再把别人的发布会,直接抄进自己的 BP。十年够长,够你把「相信」和「验证」分开。可以先信,但最好先问一句,野外测过吗。
眼镜只是前台硬件。更长的博弈,发生在 OODA 被外接之后,国家、资本与规则如何在新基线上重新定价。
若只记一句可转发的话。
五角大楼文书要求人类判断。OODA 只剩三秒时,人类判断往往只剩点头。
IVAS 时间轴、Lattice 合同要点、大基金与具身赛道公司清单等延伸资料,我会陆续上传 嗖嗖后花园。想多走一步的读者,文末见。

夜雨聆风