乐于分享
好东西不私藏

小鹏发布AI推理加速工具X-Cache,推理速度提升2.7倍

小鹏发布AI推理加速工具X-Cache,推理速度提升2.7倍

ZAKER

4月29日,小鹏汽车发布推理加速工具X-Cache技术报告。这款专为小鹏自家世界模型X-World量身打造的加速引擎,无需额外训练、即插即用,可将X-World的推理速度提升约2.7倍,生成延迟从3.6秒压缩至1.37秒,重复计算减少近七成。

简单说,小鹏给自家的”AI虚拟驾校”嵌入了一套跳过重复计算的控制逻辑,推理速度直接提升2.7倍。

X-World是小鹏用于生成自动驾驶仿真画面的世界模型,相当于一个”虚拟路考场”。智驾系统在上路之前,需要在海量虚拟场景中反复训练和验证,比如雨天、逆光、加塞、鬼探头,这些真实路况都可以在X-World里批量生成、无限复现。仿真规模越大,训练出来的智驾系统越鲁棒。

大规模仿真的代价是算力。在连续的仿真画面生成中,相邻两帧内容高度相似,如车辆位置微移、光影细微变化等,大量中间计算结果其实可以复用,却被系统一遍遍重新计算,白白消耗算力。

X-Cache的做法是把这些中间结果缓存下来,下一帧生成时直接调用,而非从头再算;缓存内容随生成实时刷新,确保画面连贯不失真。相比扩大模型规模或增加硬件算力,X-Cache的额外开销有限——它是一段控制逻辑,缓存内容随生成实时刷新,整体开销与模型参数量相比可控。

小鹏在2026年不到四个月内密集发布AI相关进展:1月发布第二代VLA大模型,面向用户端的感知与驾驶决策;3月公开X-World世界模型技术报告,作为智驾系统训练与验证的仿真基础;4月底推出X-Cache,针对X-World的推理效率问题提出解决方案。三者分别对应决策、仿真、提速三个层面,技术逻辑上相互依存。

第二代VLA已于3月19日启动首批推送,覆盖P7 Ultra、G7 Ultra、X9 Ultra;4月起扩展至P7+、G9、G6等主力车型,并计划于今年内向MAX车主推送蒸馏版第二代VLA。

北京车展期间,小鹏发布了第二代VLA首份用户智驾报告。数据显示,Ultra车主提车第一周每天开启NGP的比例达98.52%,百公里接管次数下降25.9%,Ultra车型订单环比增长118%。4月1日至19日,小鹏整体订单环比增74.4%、同比增56.8%,用户下单决策时间缩短44.7%。

来源:星河商业观察

#小鹏 #第二代VLA大模型 #Ultra #自动驾驶 #X-Cache