AI上车深水区:从ChatBot到整车智能体,阶跃星辰与千里科技给出新答案

关于AI与汽车融合的讨论，如今最缺的并非响亮的口号，而是一条能够真正实现从模型到规模化生产的完整链路。

在北京车展上，极氪8X凭借一段新车的演示视频迅速走红。视频中，用户只是随口说了一句：“带我去接孩子放学，顺便找一家麦当劳，5点前我要到学校。” 接下来的场景，完全颠覆了人们对“智能汽车”的传统认知。车辆自动规划好了最优路线，启动了智能驾驶功能，途中在麦当劳短暂停留，最终精准驶至学校门口并完成了自动泊车。整个过程中，用户无需手动触碰导航、切换智驾模式，更不必在停车场里费心寻找车位。

这并非一个简单的语音助手在替你搜索信息，而是一个AI智能体在直接执行你的指令。

这个看似炫酷的演示背后，所依赖的并不仅仅是“在车内接入一个强大的人工智能模型”，而是一套从“大脑”（决策系统）到“四肢”（执行机构）全面打通的整车智能体系统。从概念提出至今，“AI上车”已经喊了整整三年。那么，为什么直到今天，我们才真正见到这样能落地的产品？

从“聊天机器人”到“AI驱动的整车”的跨越

回顾2024年至2025年的“大模型上车”热潮，一个尴尬的现实逐渐浮出水面：虽然大模型被装进了车里，但它并未真正成为车辆的一部分。几乎所有车企都宣布接入了DeepSeek、千问、豆包等大模型，座舱内的语音助手确实变得更加聪明了——它能陪你闲聊，能帮你查询百科知识，甚至一些做得好的，还把车辆使用手册的内容也整合了进去，可以回答“轮胎气压报警怎么办”这类具体问题。

但说到底，这仍然只是一个运行在座舱里的对话机器人。语音助手无法控制方向盘，智驾系统也完全不知道你刚才和车机聊了什么。这就好比给一个人装了一颗绝顶聪明的大脑，但大脑和手脚之间缺乏神经连接。智能驾驶技术本身拥有自己的演进路线——从规则驾驶到BEV+Transformer，再到端到端模型，直至VLA+世界模型——但这条路与座舱智能的发展完全是两条平行线。

这种“割裂”并非因为没人想解决，而是技术上确实面临巨大挑战。

第一个挑战在于模型本身。行业内的主流做法，是拿一个通用的大语言模型，再用智能驾驶的数据进行后训练。这种“拼接式”的路径，虽然能让模型进行对话，却无法让它真正理解物理世界。例如，它不理解交警手势的含义，不懂复杂十字路口里行人与车辆之间微妙的博弈逻辑。要想迈向L4级别自动驾驶，模型必须从预训练阶段就开始建立对物理世界的深刻理解，而不是事后“补课”。

第二个挑战在于架构。目前，智能驾驶系统和智能座舱系统通常分属两套独立的系统、两颗不同的芯片、由两个不同的团队负责。要实现“一句话调动全车”的终极体验，整车电子电气架构必须从底层进行重构——感知、决策、交互这三者，必须统一在同一个模型体系之下。

第三个挑战是量产。从一份PPT演示到一辆真正的量产车，中间横亘着芯片适配、车规级安全认证、成本控制以及OTA持续迭代等重重关卡。依靠拼凑式的合作模式，很难高效地跑通这个完整的闭环。

一言以蔽之，真正的AI汽车，需要的不是在车内放一个聪明的大模型，而是要用AI技术去彻底重写汽车的底层逻辑。

谁有更好的答案？

2026年北京车展即将启幕之际，几乎所有车企都在高呼“AI汽车”的口号。然而，当你深入审视各家推出的具体方案时，便会发现它们所瞄准的实际上是截然不同的应用层次。

智己与阿里联手打造的IM AIOS生态座舱，其独特优势在于将阿里的生态系统——包括饿了么、高德以及支付宝——以智能代理的形式无缝整合进车辆内部。用户只需通过自然语言发出指令，就能完成点外卖或预订餐厅等操作，这种体验确实令人耳目一新。但需要指出的是，这项技术的核心定位仅限于座舱的服务层面，并未涉及与智能驾驶的深度融合。

相比之下，字节跳动旗下的豆包大模型已成功接入别克至境、荣威等多个汽车品牌的座舱系统，其主要作用在于提升语音交互的智能化水平。这本质上是一种“模型即服务”的轻量级合作模式：模型供应商提供API接口，车企在座舱中直接调用，双方职责分明，边界清晰。

上述方案各有其可取之处，但它们存在一个共同特征：模型与车辆之间仅仅是通过API接口建立起关联，而非从底层架构上实现彻底融合。

就在4月22日，阶跃星辰与千里科技正式宣布达成全方位战略合作关系，双方将合力打造“原生智驾基座模型”。这一合作所采取的策略，与前述几种方案相比，完全走上了一条别具一格的路径。

核心差异在于「原生强耦合」。

过去，行业普遍习惯这样操作：先捣鼓出一个通用的基础大模型，随后再根据车端需求进行适配。但阶跃与千里的玩法却完全反了过来——它们从预训练阶段起，就把通用知识与智能驾驶数据一并注入到基础模型之中，让模型在诞生之初就天然具备了理解物理世界的能力。这就好比，不再硬塞给汽车一个通用的“大脑”，而是一开始就专门培养出一个“会开车”的脑子。

阶跃星辰的技术基础足以支撑这一构想。作为国内知名的基模公司，阶跃围绕“AI+终端”战略，搭起了一整套完备的技术框架。其面向Agent场景的旗舰基座模型Step 3.5 Flash，自发布以来在OpenRouter上的调用量已经冲到全球第一，成为全球开发者打造智能体时的首选模型之一。

在多模态领域，阶跃拥有目前国内最齐全的自研模型矩阵——涵盖语音交互、音频推理、图像理解、图像生成以及视觉语言模型。这一套组合拳，几乎覆盖了汽车场景从“听”到“看”再到“说”的全链路感知需求。而在部署层面，阶跃构建了一个从1B到200B参数的端云协同模型体系：端侧轻量模型负责实时感知和快速执行，云侧大模型则专注于复杂场景的推理与决策，形成了一种类似人类“快思考+慢思考”的分层结构。

另一边，千里科技补全了另一半拼图——全栈的工程能力。

这段合作关系远非表面上的商业联盟可比，实质上是一场对“AI原生汽车”终局共识的豪赌。双方在技术架构上实现了无缝对接，产品蓝图也高度契合，从模型构思到终端落地，形成了一个毫无缺口的闭环。

外界有声音将其视为中国最贴合“Grok + FSD”叙事的组合——特斯拉凭借Grok大模型与FSD智驾系统的原生融合，定义了AI汽车的标杆，而阶跃星辰与千里的搭配，恰恰是中国目前最接近这一模式的样板。

值得注意的是，阶跃星辰的生态布局仍在持续扩展。

4月23日，阶跃星辰与腾讯云正式签署战略合作，焦点围绕智能座舱展开深度协作。腾讯在音乐、视频、地图、支付等领域的庞大生态体系，将通过智能座舱Agent与用户直接对接——依据个性化喜好推送内容，打通从需求识别到交易完成的全链条车内服务闭环。

如果说阶跃与千里的组合解决了“大脑搭配四肢”的基座问题，腾讯云的加入则补齐了“生态服务层”，让这个智能体不仅能自如驾驶，还能替你点歌、导航、完成支付。

真正的「AI 汽车」，要来了

极氪8X，堪称阶跃与千里在“Grok+FSD”模式下，量产落地的最新代表作。

从Step 3.5 Flash全面开源到正式装车，前后仅花费了40多天时间。这个速度本身，已经直接验证了原生强耦合模式在工程效率上的显著优势。

极氪8X首发的超级Eva整车智能体，将大模型与智驾、底盘、动力系统进行了原生融合。借助阶跃最强的语音模型，Eva能理解情绪、具备思辨能力，语音自然且富有情感；同时，依托视觉理解模型，它能感知周围环境并作出判断——路况、车位、周边商铺，全部处于它的感知范围之内。

4月17日，极氪8X正式上市，仅29分钟，大定就突破了10000台。市场，正在用真金白银表达态度。

两年前，大模型刚上车时，最多能帮你查一下附近的麦当劳在哪里。如今，它能够替你规划路线、完成驾驶、自动泊车、甚至帮你点餐，整个过程只需一句话。

这一变化的背后，不是某个模型变强了，而是模型与汽车的关系发生了根本性转变——从“外挂App”进化成了“原生大脑”。

当AI真正成为汽车的底层底座，而不再是可有可无的配件，驾驶体验的全面变革，才刚刚拉开序幕。