小鹏发布AI推理加速工具X-Cache,推理速度提升2.7倍-夜雨聆风

小鹏发布AI推理加速工具X-Cache,推理速度提升2.7倍

ZAKER

4月29日，小鹏汽车发布推理加速工具X-Cache技术报告。这款专为小鹏自家世界模型X-World量身打造的加速引擎，无需额外训练、即插即用，可将X-World的推理速度提升约2.7倍，生成延迟从3.6秒压缩至1.37秒，重复计算减少近七成。

简单说，小鹏给自家的”AI虚拟驾校”嵌入了一套跳过重复计算的控制逻辑，推理速度直接提升2.7倍。

X-World是小鹏用于生成自动驾驶仿真画面的世界模型，相当于一个”虚拟路考场”。智驾系统在上路之前，需要在海量虚拟场景中反复训练和验证，比如雨天、逆光、加塞、鬼探头，这些真实路况都可以在X-World里批量生成、无限复现。仿真规模越大，训练出来的智驾系统越鲁棒。

大规模仿真的代价是算力。在连续的仿真画面生成中，相邻两帧内容高度相似，如车辆位置微移、光影细微变化等，大量中间计算结果其实可以复用，却被系统一遍遍重新计算，白白消耗算力。

X-Cache的做法是把这些中间结果缓存下来，下一帧生成时直接调用，而非从头再算；缓存内容随生成实时刷新，确保画面连贯不失真。相比扩大模型规模或增加硬件算力，X-Cache的额外开销有限——它是一段控制逻辑，缓存内容随生成实时刷新，整体开销与模型参数量相比可控。

小鹏在2026年不到四个月内密集发布AI相关进展：1月发布第二代VLA大模型，面向用户端的感知与驾驶决策；3月公开X-World世界模型技术报告，作为智驾系统训练与验证的仿真基础；4月底推出X-Cache，针对X-World的推理效率问题提出解决方案。三者分别对应决策、仿真、提速三个层面，技术逻辑上相互依存。

第二代VLA已于3月19日启动首批推送，覆盖P7 Ultra、G7 Ultra、X9 Ultra；4月起扩展至P7+、G9、G6等主力车型，并计划于今年内向MAX车主推送蒸馏版第二代VLA。

北京车展期间，小鹏发布了第二代VLA首份用户智驾报告。数据显示，Ultra车主提车第一周每天开启NGP的比例达98.52%，百公里接管次数下降25.9%，Ultra车型订单环比增长118%。4月1日至19日，小鹏整体订单环比增74.4%、同比增56.8%，用户下单决策时间缩短44.7%。

来源：星河商业观察

#小鹏 #第二代VLA大模型 #Ultra #自动驾驶 #X-Cache