AI 不只会写代码:Applied Intuition 要让矿车、无人机和军舰自己动起来

AI 不只会写代码：Applied Intuition 要让矿车、无人机和军舰自己动起来

本文是 Latent Space 对 Applied Intuition CEO Qasar Younis 与 CTO Peter Ludwig 的访谈完整版内容稿。

01 Physical AI 的机会：让 AI 从屏幕走进真实世界

主持人：今天我们聊 Applied Intuition。你们做的不是屏幕里的 AI，而是进入车辆、无人系统、矿山、农业设备、军舰和其他真实物理环境里的 AI。

Qasar：是的，我们关心的是 Physical AI。它不是只生成文本或代码，而是要让智能系统在真实世界里感知、决策和行动。

主持人：这和现在很火的 agent 有什么关系？

Peter：两者有共通点，都是让模型不只回答问题，而是完成任务。但物理世界更难，因为系统要面对传感器、执行器、延迟、安全和现实环境的不确定性。

主持人：所以 Physical AI 的难点不是“模型会不会推理”，而是“模型能不能安全地控制现实系统”。

Peter：对，尤其在车辆、机器人、无人机、矿山设备或者国防场景里，错误不是网页刷新一下就能解决，它可能会带来真实后果。

主持人：Applied Intuition 最初为什么会从这个方向切入？

Qasar：我们一直相信，软件和 AI 会深刻改变车辆和物理系统。但这条路不是只做一个漂亮 demo，而是要做能被产业真正采用的基础设施。

02 十年前就看见的方向：车辆会被软件和 AI 重写

主持人：十年前创办公司时，什么是清楚的，什么是不清楚的？

Peter：清楚的是，车辆和物理系统里还有大量软件和 AI 能改造的空间。

主持人：不清楚的是什么？

Peter：具体路径并不清楚。这个领域技术变化很快，我们自己的技术栈大概每两年就会经历一次完整演进。

主持人：所以这不是一条线性路线。

Peter：不是。我们会根据研究进展、客户需求和工程现实不断调整。现在回头看，可能已经经历了四次左右技术栈演化。

主持人：这对团队工程方式有什么影响？

Peter：我们会用两年左右的视角看技术投入。既要投入足够深，也要保持动态，随时准备跟上新的研究和系统机会。

主持人：这听起来很像 AI 时代所有公司的问题，只是你们的周期更长、代价更高。

Qasar：对，物理世界的产品不是今天换个提示词明天上线，它需要长期积累，但也必须跟上 AI 的变化。

03 为什么 Applied Intuition 能吸引前创始人和强工程师

主持人：你们招了很多前创始人，也有很多来自 Google 等大公司的工程师。为什么这些人会被吸引？

Qasar：因为这里既需要技术能力，也需要非技术能力。

主持人：什么意思？

Qasar：我们有研究团队，也会做基础研究和发表论文，但公司本质上更偏 applied。我们要把智能部署到生产环境里。

主持人：所以不是只在论文里证明某个方法有效。

Qasar：对，我们关心的是客户能不能用，系统能不能在真实环境里工作，产品能不能解决具体问题。

主持人：这对人才画像有什么要求？

Qasar：有些人特别喜欢把前沿智能真正落地。他们不只是想研究模型，还想看到模型进入车辆、机器、工厂和国防系统。

Peter：这也是这个领域有吸引力的地方。你会同时遇到 AI、系统软件、仿真、硬件、操作系统和安全关键工程问题。

04 Applied Intuition 的三层技术栈：仿真、操作系统和车载智能

主持人：你们的技术栈到底包括什么？

Peter：可以粗略分成几个大块：仿真和开发工具、安全关键操作系统，以及车载或设备端的智能系统。

主持人：先说仿真。

Peter：仿真是为了让开发者能在真实部署前测试系统。对于车辆和机器人来说，你不可能只靠真实路测或真实场景学习，成本和风险都太高。

主持人：所以仿真是 Physical AI 的训练场和测试场。

Peter：对，而且它不只是视觉效果。你要模拟传感器、环境、行为、边界条件和系统响应。

主持人：操作系统又是什么角色？

Peter：物理系统里有各种传感器、执行器、电机、转向、冗余系统和实时数据流。你需要非常底层、低延迟、可控的系统支持。

主持人：不能把普通桌面系统直接搬进去。

Peter：完全不行。安全关键系统对延迟、内存、实时性和可靠性要求非常高。

主持人：第三层是设备端智能？

Peter：是的，最终 AI 要在车辆或设备上运行，要理解世界、做出决策，并输出控制信号。

05 为什么 Physical AI 不能只靠一个大模型

主持人：在文本和代码世界里，很多人觉得只要模型足够强，产品就能成立。物理世界是不是不一样？

Peter：很不一样。

主持人：差异在哪里？

Peter：物理世界有传感器、硬件差异、实时约束、安全冗余和大量系统级问题。模型只是其中一部分。

主持人：所以你们要关心整个系统的性能。

Peter：对，我们关心从传感器输入到控制输出的每一个环节。延迟、内存管理、芯片支持、操作系统调度都很重要。

主持人：这和传统 AI 应用的抽象层级完全不同。

Peter：如果你写 LLM 应用，可能默认自己在 CUDA 或 NVIDIA 生态里。但在安全关键物理系统里，硬件非常多样，不是只有一两个平台。

主持人：这意味着软件必须高度可移植。

Peter：是的，我们要支持不同芯片、不同设备、不同客户架构，同时保持核心能力可复用。

06 客户想买什么：完整栈、操作系统，还是开发工具

主持人：你们的技术在不同客户之间能复用多少？

Peter：核心技术高度可复用，但具体部署会涉及硬件、芯片、传感器和客户架构差异。

主持人：客户是买完整栈，还是只买某一层？

Peter：都有可能。有些客户想要我们的 autonomy 技术和操作系统一起用，有些只想用操作系统，再接自己的 autonomy 技术，也有人只需要开发工具。

主持人：所以 Applied Intuition 不是一个单点产品。

Peter：更像一个 better-together stack。不同层可以分开用，但组合起来会更强。

主持人：这种模式对产业客户很重要。

Qasar：是的，因为汽车、矿山、农业、国防等客户的成熟度不同。你不能只给一个固定答案，要能进入他们已有系统。

主持人：你们的客户为什么需要这种供应商？

Qasar：因为他们知道 AI 会改变行业，但他们不一定有能力自己从底层仿真、OS、工具链到智能系统全部做完。

07 C++、Rust 和低延迟：Physical AI 的工程底座

主持人：你们底层主要用什么语言？C++ 吗？

Peter：我们用很多 C++。

主持人：Rust 呢？

Peter：Rust 是现在很热的选择，在一些地方会用。但越往底层走，尤其碰到实时约束，还是会遇到 C++，有时甚至需要更底层的优化。

主持人：这和普通 Web AI 应用差别很大。

Peter：是的。Physical AI 的工程不是只写 API glue code，而是要关心内存、延迟、编译目标、硬件支持和安全。

主持人：这会不会让 AI coding agent 的采用更难？

Peter：会更复杂，因为很多代码更底层，约束更强，抽象也更数学化。

主持人：但你们也在用 AI coding 工具？

Peter：当然。我们也在探索如何让 agent 参与工程工作，只是它必须理解更复杂的系统边界。

08 AI coding 正在改变工具形态：从 GUI 到文本控制

主持人：你们有很多工程工具过去是 GUI 密集型的，比如传感器设计。

Peter：对，比如 Sensor Studio，用户可以设计自动驾驶系统的传感器套件，决定传感器放在哪里、用什么组合、有哪些 trade-off。

主持人：这听起来像 CAD 工具。

Peter：有点像。过去很多任务需要图形界面，因为问题很空间化、很工程化。

主持人：AI agent 会怎么改变这个？

Peter：现在我们可以把底层 API 暴露出来，让用户通过文本配置传感器套件，甚至可能比纯 GUI 更快得到好结果。

主持人：也就是说，Physical AI 里的工具也在从“人点界面”变成“人用语言驱动系统”。

Peter：是的，我们正在把这种思路扩展到整个产品组合。

主持人：这和软件开发里 Claude Code、Cursor 的变化很像。

Peter：很像，只是我们的对象从代码库变成了传感器、车辆、仿真和物理系统。

09 Verifiable rewards 和 evals：越强的模型越难评估

主持人：现在 AI 圈很关注 verifiable reward 和 reinforcement learning。你们在物理系统里怎么看 evals？

Peter：更广义地说，问题是如何评估系统结果。

主持人：你觉得这是最难的问题之一？

Peter：是的。模型越强，系统越复杂，找出故障反而越难。

主持人：为什么？

Peter：简单系统出错很明显，但强模型可能在大多数情况下表现很好，只在边界条件下失败。

主持人：而物理世界的边界条件非常多。

Peter：对，天气、传感器噪声、道路状态、设备磨损、对抗环境、异常行为，都会影响系统。

主持人：所以 eval 不是做几个 benchmark 就够。

Peter：完全不够。安全关键系统需要系统化评估，要覆盖真实部署中的长尾场景。

Qasar：这也是为什么仿真很重要。它帮助我们构造和反复测试真实世界里很难高频遇到、但一旦遇到就很关键的场景。

10 Neural simulation：仿真也正在被 AI 重写

主持人：仿真过去更像物理引擎，现在 AI 会怎么改变它？

Peter：传统仿真依赖大量手写规则和物理建模，但神经网络可以帮助我们生成更真实、更复杂的环境和行为。

主持人：这是不是意味着仿真会越来越像世界模型？

Peter：某种程度上是。我们希望系统不仅能渲染场景，还能更好地预测环境如何变化、其他 actor 会怎么行动。

主持人：这对训练和评估都很重要。

Peter：对，Physical AI 需要大量场景、多样性和长尾情况。神经仿真可以扩大测试空间。

主持人：但仿真不能只是看起来真实。

Peter：没错，关键是它对系统决策有没有评估价值。漂亮画面不等于有用仿真。

Qasar：客户关心的是部署风险降低了没有，开发周期缩短了没有，真实系统更安全吗。

11 End-to-end autonomy：从传感器到控制信号

主持人：现在 autonomy 里最热的方向之一是 end-to-end。

Peter：是的，你可以训练模型从传感器数据直接到控制信号，并且取得很好的结果。

主持人：这听起来像把感知、预测、规划和控制都压进一个模型。

Peter：方向上是这样，但工程上仍然要非常谨慎。

主持人：为什么？

Peter：因为你不仅要看平均表现，还要看可解释性、可验证性、安全边界和系统集成。

主持人：End-to-end 能解决很多手工模块的问题，但也带来新的评估难题。

Peter：对，它很强，但不意味着你可以放弃系统工程。

Qasar：客户最终不是购买一个研究概念，而是购买一个能被部署、被验证、被维护的系统。

12 Plan mode for physical systems：物理世界也需要先计划再行动

主持人：在 coding agent 里，很多系统有 plan mode，先规划复杂任务，再执行。物理自治系统里也有类似东西吗？

Peter：短答案是有。

主持人：怎么理解？

Peter：就像 Claude Code 可以先为复杂代码任务写出接近规格说明的计划，物理系统也可以先规划多步行动。

主持人：最容易想到的是 robotaxi。

Peter：对，但更有意思的可能是国防、矿山和工业场景。那里一个目标可能需要上百个步骤，不是眼前这一秒怎么转弯这么简单。

主持人：所以 plan mode 在物理系统里更像任务级决策。

Peter：是的，要理解目标、约束、环境和后续动作，不能只做局部反应。

主持人：这和“next-token prediction”有什么关系？

Peter：某些驾驶问题看起来确实像连续预测下一步，但真实系统还需要长期计划、约束满足和安全验证。

13 国防、矿山、农业：Physical AI 为什么不止是自动驾驶

主持人：外界提到 Applied Intuition，很多人首先想到自动驾驶。但你们谈的场景更宽。

Qasar：是的，汽车只是其中一部分。Physical AI 会进入矿山、农业、建筑、无人机、国防和其他复杂环境。

主持人：这些场景有什么共同点？

Peter：它们都有真实世界的机器、传感器、执行器和安全约束，也都有大量重复但复杂的任务。

主持人：和普通乘用车相比，矿山或国防场景会有什么不同？

Peter：环境可能更受控，也可能更恶劣；任务可能更长链路；系统需要更强鲁棒性。

主持人：这也意味着产品不能只为一个垂直场景写死。

Qasar：对，平台能力必须复用，但也要能深入不同行业的问题。

主持人：这就是你们既做通用栈，又做具体行业应用的原因。

Qasar：是的，Physical AI 的价值在于把底层智能转化为具体行业生产力。

14 创业建议：小问题切深，比大愿景铺浅更重要

主持人：如果今天有 founder 想做类似硬科技或 AI 公司，应该从大愿景开始，还是从窄问题切入？

Qasar：我更倾向于从小问题空间切深。

主持人：为什么？

Qasar：特别是 hard tech，公司面对的问题太多。如果一开始铺得很宽，很容易每件事都做得很平庸。

主持人：这听起来很 YC。

Qasar：是的，找到一个小问题，做得非常深，然后让问题空间随着产品和客户一起扩大。

主持人：但 Applied Intuition 最开始也有很强背景和网络，这是不是普通 founder 很难复制？

Qasar：当然。不要照抄别人的路径。每个 founder 的技能、团队、客户、市场阶段都不同。

主持人：所以不能直接模仿 Jensen、Sam Altman 或某个成功 founder。

Qasar：对，他们处在不同时间、不同阶段、不同公司条件下。你只能回到第一性原理。

主持人：第一性原理是什么？

Qasar：基于你、你的 cofounder、早期团队能力，以及客户告诉你的问题，判断你该进入哪个产品空间。

15 YC 旧建议为什么不一定适用于 2026 年

主持人：Sam Altman 说过他后悔过一些早期 YC 建议。你怎么看？

Qasar：市场变了，AI 公司和其他创业公司的关系也变了。

主持人：哪里变了？

Qasar：资金环境、投资人数量、AI 公司需要的资本规模、人才竞争，都和 2014 年完全不同。

主持人：所以旧 YC 建议不能直接搬到今天。

Qasar：对。不是 YC 错了，而是市场结构变了。

主持人：那 founder 应该怎么判断？

Qasar：不要迷信某个时代的模板。你要看今天的市场、今天的客户、今天的技术条件。

主持人：这对 AI founder 尤其重要。

Qasar：是的，AI 公司要面对的资本、算力、人才和产品化压力，都和传统软件公司不同。

16 最值得攻克的技术问题：让大模型变小、变快、可评估

主持人：Peter，如果有人正在做研究，你觉得哪些问题对 Applied Intuition 特别有意义？

Peter：一个是模型效率。

主持人：为什么效率这么重要？

Peter：因为我们要把很大的 AI 放到真实车辆和物理设备上运行。Physical AI 经常是把大模型变小、变快、变高效。

主持人：这包括能力，也包括延迟。

Peter：对，模型性能既包括 capability，也包括实际 latency、资源占用和部署成本。

主持人：另一个问题是 evals？

Peter：是的，评估安全关键系统里的模型非常难。我们已经有很强团队在做，但这仍然是非常大的投资方向。

主持人：所以你们欢迎对模型性能和评估有热情的人。

Peter：没错，尤其是能把研究变成可部署系统的人。

17 这期访谈真正说明的：Physical AI 是下一代基础设施

主持人：如果把整期访谈放在一起看，Applied Intuition 讲的不是一个自动驾驶工具，而是一套 Physical AI 基础设施。

Qasar：我们希望把智能部署到真实世界，而不是停留在 demo 或屏幕里。

主持人：这套基础设施包括仿真、OS、工具链、车载智能、evals 和行业产品。

Peter：是的，而且每一层都必须考虑真实部署约束。

主持人：这和互联网 AI 最大的区别是什么？

Peter：互联网 AI 的错误通常更容易回滚，物理 AI 的错误可能影响真实世界。所以系统工程和安全验证同样重要。

主持人：对中国 AI 创业者来说，这里有什么启发？

Qasar：不要只追逐大词，要找到一个真实产业里的小问题，把它做深。

Peter：也不要低估工程底座。Physical AI 不是单个模型，而是模型、工具、仿真、操作系统和评估系统的组合。

主持人：所以真正的问题不是“AI 能不能开车”，而是“AI 能不能在各种物理系统里可靠工作”。

Peter：对，这会是一个长期、复杂，但非常重要的方向。