乐于分享
好东西不私藏

AI上车深水区:从ChatBot到整车智能体,阶跃星辰与千里科技给出新答案

AI上车深水区:从ChatBot到整车智能体,阶跃星辰与千里科技给出新答案

关于AI与汽车融合的讨论,如今最缺的并非响亮的口号,而是一条能够真正实现从模型到规模化生产的完整链路。

在北京车展上,极氪8X凭借一段新车的演示视频迅速走红。视频中,用户只是随口说了一句:“带我去接孩子放学,顺便找一家麦当劳,5点前我要到学校。” 接下来的场景,完全颠覆了人们对“智能汽车”的传统认知。车辆自动规划好了最优路线,启动了智能驾驶功能,途中在麦当劳短暂停留,最终精准驶至学校门口并完成了自动泊车。整个过程中,用户无需手动触碰导航、切换智驾模式,更不必在停车场里费心寻找车位。

这并非一个简单的语音助手在替你搜索信息,而是一个AI智能体在直接执行你的指令。

这个看似炫酷的演示背后,所依赖的并不仅仅是“在车内接入一个强大的人工智能模型”,而是一套从“大脑”(决策系统)到“四肢”(执行机构)全面打通的整车智能体系统。从概念提出至今,“AI上车”已经喊了整整三年。那么,为什么直到今天,我们才真正见到这样能落地的产品?

从“聊天机器人”到“AI驱动的整车”的跨越

回顾2024年至2025年的“大模型上车”热潮,一个尴尬的现实逐渐浮出水面:虽然大模型被装进了车里,但它并未真正成为车辆的一部分。几乎所有车企都宣布接入了DeepSeek、千问、豆包等大模型,座舱内的语音助手确实变得更加聪明了——它能陪你闲聊,能帮你查询百科知识,甚至一些做得好的,还把车辆使用手册的内容也整合了进去,可以回答“轮胎气压报警怎么办”这类具体问题。

但说到底,这仍然只是一个运行在座舱里的对话机器人。语音助手无法控制方向盘,智驾系统也完全不知道你刚才和车机聊了什么。这就好比给一个人装了一颗绝顶聪明的大脑,但大脑和手脚之间缺乏神经连接。智能驾驶技术本身拥有自己的演进路线——从规则驾驶到BEV+Transformer,再到端到端模型,直至VLA+世界模型——但这条路与座舱智能的发展完全是两条平行线。

这种“割裂”并非因为没人想解决,而是技术上确实面临巨大挑战。

第一个挑战在于模型本身。行业内的主流做法,是拿一个通用的大语言模型,再用智能驾驶的数据进行后训练。这种“拼接式”的路径,虽然能让模型进行对话,却无法让它真正理解物理世界。例如,它不理解交警手势的含义,不懂复杂十字路口里行人与车辆之间微妙的博弈逻辑。要想迈向L4级别自动驾驶,模型必须从预训练阶段就开始建立对物理世界的深刻理解,而不是事后“补课”。

第二个挑战在于架构。目前,智能驾驶系统和智能座舱系统通常分属两套独立的系统、两颗不同的芯片、由两个不同的团队负责。要实现“一句话调动全车”的终极体验,整车电子电气架构必须从底层进行重构——感知、决策、交互这三者,必须统一在同一个模型体系之下。

第三个挑战是量产。从一份PPT演示到一辆真正的量产车,中间横亘着芯片适配、车规级安全认证、成本控制以及OTA持续迭代等重重关卡。依靠拼凑式的合作模式,很难高效地跑通这个完整的闭环。

一言以蔽之,真正的AI汽车,需要的不是在车内放一个聪明的大模型,而是要用AI技术去彻底重写汽车的底层逻辑。

谁有更好的答案?

2026年北京车展即将启幕之际,几乎所有车企都在高呼“AI汽车”的口号。然而,当你深入审视各家推出的具体方案时,便会发现它们所瞄准的实际上是截然不同的应用层次。

智己与阿里联手打造的IM AIOS生态座舱,其独特优势在于将阿里的生态系统——包括饿了么、高德以及支付宝——以智能代理的形式无缝整合进车辆内部。用户只需通过自然语言发出指令,就能完成点外卖或预订餐厅等操作,这种体验确实令人耳目一新。但需要指出的是,这项技术的核心定位仅限于座舱的服务层面,并未涉及与智能驾驶的深度融合。

相比之下,字节跳动旗下的豆包大模型已成功接入别克至境、荣威等多个汽车品牌的座舱系统,其主要作用在于提升语音交互的智能化水平。这本质上是一种“模型即服务”的轻量级合作模式:模型供应商提供API接口,车企在座舱中直接调用,双方职责分明,边界清晰。

上述方案各有其可取之处,但它们存在一个共同特征:模型与车辆之间仅仅是通过API接口建立起关联,而非从底层架构上实现彻底融合。

就在4月22日,阶跃星辰与千里科技正式宣布达成全方位战略合作关系,双方将合力打造“原生智驾基座模型”。这一合作所采取的策略,与前述几种方案相比,完全走上了一条别具一格的路径。

核心差异在于「原生强耦合」。

过去,行业普遍习惯这样操作:先捣鼓出一个通用的基础大模型,随后再根据车端需求进行适配。但阶跃与千里的玩法却完全反了过来——它们从预训练阶段起,就把通用知识与智能驾驶数据一并注入到基础模型之中,让模型在诞生之初就天然具备了理解物理世界的能力。这就好比,不再硬塞给汽车一个通用的“大脑”,而是一开始就专门培养出一个“会开车”的脑子。

阶跃星辰的技术基础足以支撑这一构想。作为国内知名的基模公司,阶跃围绕“AI+终端”战略,搭起了一整套完备的技术框架。其面向Agent场景的旗舰基座模型Step 3.5 Flash,自发布以来在OpenRouter上的调用量已经冲到全球第一,成为全球开发者打造智能体时的首选模型之一。

在多模态领域,阶跃拥有目前国内最齐全的自研模型矩阵——涵盖语音交互、音频推理、图像理解、图像生成以及视觉语言模型。这一套组合拳,几乎覆盖了汽车场景从“听”到“看”再到“说”的全链路感知需求。而在部署层面,阶跃构建了一个从1B到200B参数的端云协同模型体系:端侧轻量模型负责实时感知和快速执行,云侧大模型则专注于复杂场景的推理与决策,形成了一种类似人类“快思考+慢思考”的分层结构。

另一边,千里科技补全了另一半拼图——全栈的工程能力。

这段合作关系远非表面上的商业联盟可比,实质上是一场对“AI原生汽车”终局共识的豪赌。双方在技术架构上实现了无缝对接,产品蓝图也高度契合,从模型构思到终端落地,形成了一个毫无缺口的闭环。

外界有声音将其视为中国最贴合“Grok + FSD”叙事的组合——特斯拉凭借Grok大模型与FSD智驾系统的原生融合,定义了AI汽车的标杆,而阶跃星辰与千里的搭配,恰恰是中国目前最接近这一模式的样板。

值得注意的是,阶跃星辰的生态布局仍在持续扩展。

4月23日,阶跃星辰与腾讯云正式签署战略合作,焦点围绕智能座舱展开深度协作。腾讯在音乐、视频、地图、支付等领域的庞大生态体系,将通过智能座舱Agent与用户直接对接——依据个性化喜好推送内容,打通从需求识别到交易完成的全链条车内服务闭环。

如果说阶跃与千里的组合解决了“大脑搭配四肢”的基座问题,腾讯云的加入则补齐了“生态服务层”,让这个智能体不仅能自如驾驶,还能替你点歌、导航、完成支付。

真正的「AI 汽车」,要来了

极氪8X,堪称阶跃与千里在“Grok+FSD”模式下,量产落地的最新代表作。

从Step 3.5 Flash全面开源到正式装车,前后仅花费了40多天时间。这个速度本身,已经直接验证了原生强耦合模式在工程效率上的显著优势。

极氪8X首发的超级Eva整车智能体,将大模型与智驾、底盘、动力系统进行了原生融合。借助阶跃最强的语音模型,Eva能理解情绪、具备思辨能力,语音自然且富有情感;同时,依托视觉理解模型,它能感知周围环境并作出判断——路况、车位、周边商铺,全部处于它的感知范围之内。

4月17日,极氪8X正式上市,仅29分钟,大定就突破了10000台。市场,正在用真金白银表达态度。

两年前,大模型刚上车时,最多能帮你查一下附近的麦当劳在哪里。如今,它能够替你规划路线、完成驾驶、自动泊车、甚至帮你点餐,整个过程只需一句话。

这一变化的背后,不是某个模型变强了,而是模型与汽车的关系发生了根本性转变——从“外挂App”进化成了“原生大脑”。

当AI真正成为汽车的底层底座,而不再是可有可无的配件,驾驶体验的全面变革,才刚刚拉开序幕。