乐于分享
好东西不私藏

AI 不只会写代码:Applied Intuition 要让矿车、无人机和军舰自己动起来

AI 不只会写代码:Applied Intuition 要让矿车、无人机和军舰自己动起来

AI 不只会写代码:Applied Intuition 要让矿车、无人机和军舰自己动起来

本文是 Latent Space 对 Applied Intuition CEO Qasar Younis 与 CTO Peter Ludwig 的访谈完整版内容稿。

01

Physical AI 的机会:让 AI 从屏幕走进真实世界

主持人:今天我们聊 Applied Intuition。你们做的不是屏幕里的 AI,而是进入车辆、无人系统、矿山、农业设备、军舰和其他真实物理环境里的 AI。
Qasar:是的,我们关心的是 Physical AI。它不是只生成文本或代码,而是要让智能系统在真实世界里感知、决策和行动。
主持人:这和现在很火的 agent 有什么关系?
Peter:两者有共通点,都是让模型不只回答问题,而是完成任务。但物理世界更难,因为系统要面对传感器、执行器、延迟、安全和现实环境的不确定性。
主持人:所以 Physical AI 的难点不是“模型会不会推理”,而是“模型能不能安全地控制现实系统”。
Peter:对,尤其在车辆、机器人、无人机、矿山设备或者国防场景里,错误不是网页刷新一下就能解决,它可能会带来真实后果。
主持人:Applied Intuition 最初为什么会从这个方向切入?
Qasar:我们一直相信,软件和 AI 会深刻改变车辆和物理系统。但这条路不是只做一个漂亮 demo,而是要做能被产业真正采用的基础设施。

02

十年前就看见的方向:车辆会被软件和 AI 重写

主持人:十年前创办公司时,什么是清楚的,什么是不清楚的?
Peter:清楚的是,车辆和物理系统里还有大量软件和 AI 能改造的空间。
主持人:不清楚的是什么?
Peter:具体路径并不清楚。这个领域技术变化很快,我们自己的技术栈大概每两年就会经历一次完整演进。
主持人:所以这不是一条线性路线。
Peter:不是。我们会根据研究进展、客户需求和工程现实不断调整。现在回头看,可能已经经历了四次左右技术栈演化。
主持人:这对团队工程方式有什么影响?
Peter:我们会用两年左右的视角看技术投入。既要投入足够深,也要保持动态,随时准备跟上新的研究和系统机会。
主持人:这听起来很像 AI 时代所有公司的问题,只是你们的周期更长、代价更高。
Qasar:对,物理世界的产品不是今天换个提示词明天上线,它需要长期积累,但也必须跟上 AI 的变化。

03

为什么 Applied Intuition 能吸引前创始人和强工程师

主持人:你们招了很多前创始人,也有很多来自 Google 等大公司的工程师。为什么这些人会被吸引?
Qasar:因为这里既需要技术能力,也需要非技术能力。
主持人:什么意思?
Qasar:我们有研究团队,也会做基础研究和发表论文,但公司本质上更偏 applied。我们要把智能部署到生产环境里。
主持人:所以不是只在论文里证明某个方法有效。
Qasar:对,我们关心的是客户能不能用,系统能不能在真实环境里工作,产品能不能解决具体问题。
主持人:这对人才画像有什么要求?
Qasar:有些人特别喜欢把前沿智能真正落地。他们不只是想研究模型,还想看到模型进入车辆、机器、工厂和国防系统。
Peter:这也是这个领域有吸引力的地方。你会同时遇到 AI、系统软件、仿真、硬件、操作系统和安全关键工程问题。

04

Applied Intuition 的三层技术栈:仿真、操作系统和车载智能

主持人:你们的技术栈到底包括什么?
Peter:可以粗略分成几个大块:仿真和开发工具、安全关键操作系统,以及车载或设备端的智能系统。
主持人:先说仿真。
Peter:仿真是为了让开发者能在真实部署前测试系统。对于车辆和机器人来说,你不可能只靠真实路测或真实场景学习,成本和风险都太高。
主持人:所以仿真是 Physical AI 的训练场和测试场。
Peter:对,而且它不只是视觉效果。你要模拟传感器、环境、行为、边界条件和系统响应。
主持人:操作系统又是什么角色?
Peter:物理系统里有各种传感器、执行器、电机、转向、冗余系统和实时数据流。你需要非常底层、低延迟、可控的系统支持。
主持人:不能把普通桌面系统直接搬进去。
Peter:完全不行。安全关键系统对延迟、内存、实时性和可靠性要求非常高。
主持人:第三层是设备端智能?
Peter:是的,最终 AI 要在车辆或设备上运行,要理解世界、做出决策,并输出控制信号。

05

为什么 Physical AI 不能只靠一个大模型

主持人:在文本和代码世界里,很多人觉得只要模型足够强,产品就能成立。物理世界是不是不一样?
Peter:很不一样。
主持人:差异在哪里?
Peter:物理世界有传感器、硬件差异、实时约束、安全冗余和大量系统级问题。模型只是其中一部分。
主持人:所以你们要关心整个系统的性能。
Peter:对,我们关心从传感器输入到控制输出的每一个环节。延迟、内存管理、芯片支持、操作系统调度都很重要。
主持人:这和传统 AI 应用的抽象层级完全不同。
Peter:如果你写 LLM 应用,可能默认自己在 CUDA 或 NVIDIA 生态里。但在安全关键物理系统里,硬件非常多样,不是只有一两个平台。
主持人:这意味着软件必须高度可移植。
Peter:是的,我们要支持不同芯片、不同设备、不同客户架构,同时保持核心能力可复用。

06

客户想买什么:完整栈、操作系统,还是开发工具

主持人:你们的技术在不同客户之间能复用多少?
Peter:核心技术高度可复用,但具体部署会涉及硬件、芯片、传感器和客户架构差异。
主持人:客户是买完整栈,还是只买某一层?
Peter:都有可能。有些客户想要我们的 autonomy 技术和操作系统一起用,有些只想用操作系统,再接自己的 autonomy 技术,也有人只需要开发工具。
主持人:所以 Applied Intuition 不是一个单点产品。
Peter:更像一个 better-together stack。不同层可以分开用,但组合起来会更强。
主持人:这种模式对产业客户很重要。
Qasar:是的,因为汽车、矿山、农业、国防等客户的成熟度不同。你不能只给一个固定答案,要能进入他们已有系统。
主持人:你们的客户为什么需要这种供应商?
Qasar:因为他们知道 AI 会改变行业,但他们不一定有能力自己从底层仿真、OS、工具链到智能系统全部做完。

07

C++、Rust 和低延迟:Physical AI 的工程底座

主持人:你们底层主要用什么语言?C++ 吗?
Peter:我们用很多 C++。
主持人:Rust 呢?
Peter:Rust 是现在很热的选择,在一些地方会用。但越往底层走,尤其碰到实时约束,还是会遇到 C++,有时甚至需要更底层的优化。
主持人:这和普通 Web AI 应用差别很大。
Peter:是的。Physical AI 的工程不是只写 API glue code,而是要关心内存、延迟、编译目标、硬件支持和安全。
主持人:这会不会让 AI coding agent 的采用更难?
Peter:会更复杂,因为很多代码更底层,约束更强,抽象也更数学化。
主持人:但你们也在用 AI coding 工具?
Peter:当然。我们也在探索如何让 agent 参与工程工作,只是它必须理解更复杂的系统边界。

08

AI coding 正在改变工具形态:从 GUI 到文本控制

主持人:你们有很多工程工具过去是 GUI 密集型的,比如传感器设计。
Peter:对,比如 Sensor Studio,用户可以设计自动驾驶系统的传感器套件,决定传感器放在哪里、用什么组合、有哪些 trade-off。
主持人:这听起来像 CAD 工具。
Peter:有点像。过去很多任务需要图形界面,因为问题很空间化、很工程化。
主持人:AI agent 会怎么改变这个?
Peter:现在我们可以把底层 API 暴露出来,让用户通过文本配置传感器套件,甚至可能比纯 GUI 更快得到好结果。
主持人:也就是说,Physical AI 里的工具也在从“人点界面”变成“人用语言驱动系统”。
Peter:是的,我们正在把这种思路扩展到整个产品组合。
主持人:这和软件开发里 Claude Code、Cursor 的变化很像。
Peter:很像,只是我们的对象从代码库变成了传感器、车辆、仿真和物理系统。

09

Verifiable rewards 和 evals:越强的模型越难评估

主持人:现在 AI 圈很关注 verifiable reward 和 reinforcement learning。你们在物理系统里怎么看 evals?
Peter:更广义地说,问题是如何评估系统结果。
主持人:你觉得这是最难的问题之一?
Peter:是的。模型越强,系统越复杂,找出故障反而越难。
主持人:为什么?
Peter:简单系统出错很明显,但强模型可能在大多数情况下表现很好,只在边界条件下失败。
主持人:而物理世界的边界条件非常多。
Peter:对,天气、传感器噪声、道路状态、设备磨损、对抗环境、异常行为,都会影响系统。
主持人:所以 eval 不是做几个 benchmark 就够。
Peter:完全不够。安全关键系统需要系统化评估,要覆盖真实部署中的长尾场景。
Qasar:这也是为什么仿真很重要。它帮助我们构造和反复测试真实世界里很难高频遇到、但一旦遇到就很关键的场景。

10

Neural simulation:仿真也正在被 AI 重写

主持人:仿真过去更像物理引擎,现在 AI 会怎么改变它?
Peter:传统仿真依赖大量手写规则和物理建模,但神经网络可以帮助我们生成更真实、更复杂的环境和行为。
主持人:这是不是意味着仿真会越来越像世界模型?
Peter:某种程度上是。我们希望系统不仅能渲染场景,还能更好地预测环境如何变化、其他 actor 会怎么行动。
主持人:这对训练和评估都很重要。
Peter:对,Physical AI 需要大量场景、多样性和长尾情况。神经仿真可以扩大测试空间。
主持人:但仿真不能只是看起来真实。
Peter:没错,关键是它对系统决策有没有评估价值。漂亮画面不等于有用仿真。
Qasar:客户关心的是部署风险降低了没有,开发周期缩短了没有,真实系统更安全吗。

11

End-to-end autonomy:从传感器到控制信号

主持人:现在 autonomy 里最热的方向之一是 end-to-end。
Peter:是的,你可以训练模型从传感器数据直接到控制信号,并且取得很好的结果。
主持人:这听起来像把感知、预测、规划和控制都压进一个模型。
Peter:方向上是这样,但工程上仍然要非常谨慎。
主持人:为什么?
Peter:因为你不仅要看平均表现,还要看可解释性、可验证性、安全边界和系统集成。
主持人:End-to-end 能解决很多手工模块的问题,但也带来新的评估难题。
Peter:对,它很强,但不意味着你可以放弃系统工程。
Qasar:客户最终不是购买一个研究概念,而是购买一个能被部署、被验证、被维护的系统。

12

Plan mode for physical systems:物理世界也需要先计划再行动

主持人:在 coding agent 里,很多系统有 plan mode,先规划复杂任务,再执行。物理自治系统里也有类似东西吗?
Peter:短答案是有。
主持人:怎么理解?
Peter:就像 Claude Code 可以先为复杂代码任务写出接近规格说明的计划,物理系统也可以先规划多步行动。
主持人:最容易想到的是 robotaxi。
Peter:对,但更有意思的可能是国防、矿山和工业场景。那里一个目标可能需要上百个步骤,不是眼前这一秒怎么转弯这么简单。
主持人:所以 plan mode 在物理系统里更像任务级决策。
Peter:是的,要理解目标、约束、环境和后续动作,不能只做局部反应。
主持人:这和“next-token prediction”有什么关系?
Peter:某些驾驶问题看起来确实像连续预测下一步,但真实系统还需要长期计划、约束满足和安全验证。

13

国防、矿山、农业:Physical AI 为什么不止是自动驾驶

主持人:外界提到 Applied Intuition,很多人首先想到自动驾驶。但你们谈的场景更宽。
Qasar:是的,汽车只是其中一部分。Physical AI 会进入矿山、农业、建筑、无人机、国防和其他复杂环境。
主持人:这些场景有什么共同点?
Peter:它们都有真实世界的机器、传感器、执行器和安全约束,也都有大量重复但复杂的任务。
主持人:和普通乘用车相比,矿山或国防场景会有什么不同?
Peter:环境可能更受控,也可能更恶劣;任务可能更长链路;系统需要更强鲁棒性。
主持人:这也意味着产品不能只为一个垂直场景写死。
Qasar:对,平台能力必须复用,但也要能深入不同行业的问题。
主持人:这就是你们既做通用栈,又做具体行业应用的原因。
Qasar:是的,Physical AI 的价值在于把底层智能转化为具体行业生产力。

14

创业建议:小问题切深,比大愿景铺浅更重要

主持人:如果今天有 founder 想做类似硬科技或 AI 公司,应该从大愿景开始,还是从窄问题切入?
Qasar:我更倾向于从小问题空间切深。
主持人:为什么?
Qasar:特别是 hard tech,公司面对的问题太多。如果一开始铺得很宽,很容易每件事都做得很平庸。
主持人:这听起来很 YC。
Qasar:是的,找到一个小问题,做得非常深,然后让问题空间随着产品和客户一起扩大。
主持人:但 Applied Intuition 最开始也有很强背景和网络,这是不是普通 founder 很难复制?
Qasar:当然。不要照抄别人的路径。每个 founder 的技能、团队、客户、市场阶段都不同。
主持人:所以不能直接模仿 Jensen、Sam Altman 或某个成功 founder。
Qasar:对,他们处在不同时间、不同阶段、不同公司条件下。你只能回到第一性原理。
主持人:第一性原理是什么?
Qasar:基于你、你的 cofounder、早期团队能力,以及客户告诉你的问题,判断你该进入哪个产品空间。

15

YC 旧建议为什么不一定适用于 2026 年

主持人:Sam Altman 说过他后悔过一些早期 YC 建议。你怎么看?
Qasar:市场变了,AI 公司和其他创业公司的关系也变了。
主持人:哪里变了?
Qasar:资金环境、投资人数量、AI 公司需要的资本规模、人才竞争,都和 2014 年完全不同。
主持人:所以旧 YC 建议不能直接搬到今天。
Qasar:对。不是 YC 错了,而是市场结构变了。
主持人:那 founder 应该怎么判断?
Qasar:不要迷信某个时代的模板。你要看今天的市场、今天的客户、今天的技术条件。
主持人:这对 AI founder 尤其重要。
Qasar:是的,AI 公司要面对的资本、算力、人才和产品化压力,都和传统软件公司不同。

16

最值得攻克的技术问题:让大模型变小、变快、可评估

主持人:Peter,如果有人正在做研究,你觉得哪些问题对 Applied Intuition 特别有意义?
Peter:一个是模型效率。
主持人:为什么效率这么重要?
Peter:因为我们要把很大的 AI 放到真实车辆和物理设备上运行。Physical AI 经常是把大模型变小、变快、变高效。
主持人:这包括能力,也包括延迟。
Peter:对,模型性能既包括 capability,也包括实际 latency、资源占用和部署成本。
主持人:另一个问题是 evals?
Peter:是的,评估安全关键系统里的模型非常难。我们已经有很强团队在做,但这仍然是非常大的投资方向。
主持人:所以你们欢迎对模型性能和评估有热情的人。
Peter:没错,尤其是能把研究变成可部署系统的人。

17

这期访谈真正说明的:Physical AI 是下一代基础设施

主持人:如果把整期访谈放在一起看,Applied Intuition 讲的不是一个自动驾驶工具,而是一套 Physical AI 基础设施。
Qasar:我们希望把智能部署到真实世界,而不是停留在 demo 或屏幕里。
主持人:这套基础设施包括仿真、OS、工具链、车载智能、evals 和行业产品。
Peter:是的,而且每一层都必须考虑真实部署约束。
主持人:这和互联网 AI 最大的区别是什么?
Peter:互联网 AI 的错误通常更容易回滚,物理 AI 的错误可能影响真实世界。所以系统工程和安全验证同样重要。
主持人:对中国 AI 创业者来说,这里有什么启发?
Qasar:不要只追逐大词,要找到一个真实产业里的小问题,把它做深。
Peter:也不要低估工程底座。Physical AI 不是单个模型,而是模型、工具、仿真、操作系统和评估系统的组合。
主持人:所以真正的问题不是“AI 能不能开车”,而是“AI 能不能在各种物理系统里可靠工作”。
Peter:对,这会是一个长期、复杂,但非常重要的方向。