乐于分享
好东西不私藏

AI主题-智驾SR | 做了个梦,第二天在车上看见了它

AI主题-智驾SR | 做了个梦,第二天在车上看见了它

你坐在车内说一句”赛博机动队”。三秒后,整个屏幕里的世界变了。
柏油路面变成冷灰色的装甲钢板地面,车道线化作流动的青色光带,隔离带变成厚重的工业护栏。路边的行人变成了全身战术甲的机动队员。你的车安静地穿过这座被军事化接管的城市。
这不是概念片。这是我们正在量产落地的「AI主题SR」。

千人一面的SR

SR是智驾感知到的环境画面的反馈,它的输入源是真实世界。但现在全世界的SR几乎长一个样 —— 同样的写实模型、灰色路面、线框车辆。
没错,L2阶段的SR是一块监控仪表,依旧承担着功能性需求。驾驶员会盯着SR判断系统状态、监控周边环境,随时准备接管。
但我们把目光拉远,在做内部的SR创新工作坊时我们思考的是未来–L4时代。当驾驶员的注意力释放后,SR的定位会如何变化?当不用再承担功能性需求,SR的产品定位该如何着力?
其中一个答案是:美学需求,SR壁纸。
于是我们顺着这个思路往下,最开始依旧是在工作坊的「草图绘制」环节中,有小伙伴很随意的用AI尝试了生成不同风格的SR界面。但却让我们从中看到了巨大潜力。

从一张图看到机会

他的尝试很简单——截了一张SR主界面的图,整张丢给AI图像模型,让它”变成赛博朋克风格”。
返回的结果让我们很激动。
霓虹灯管、暗色调、雨雾漫反射—— 一张静态的飞机稿,居然已经这么有氛围了。
AI把我们脑海中那些模糊的想象,具像化地摆在了眼前,让我们可以直接评估它的价值。
那一刻,团队意识到这里面藏着一个巨大的机会:AI的创造力是无限的,一千个用户可以有一千个哈姆雷特。
当然,这离最终形态还差得远。
我们的目标是一个实时感知渲染、可交互的3D世界,而且每一帧都得比这张图片还精致。方向对了,剩下的就是一步一步把它做出来。
对了,如果看到这里的你仍有兴趣,也可以跟着我们接下来分享的内容一一尝试。如果遇到问题欢迎后台私信,我们非常乐于做此类的技术探讨。

阶段一:拆分元素

要把2D图变成一个能在3D引擎里真实跑起来的AI世界,第一步就是构成的元素。
SR画面本就由几层不同性质的元素构成。自行车属于动态交通参与者;锥桶则是静态交通元素;还有天空、绿植等是静态环境元素。
SR中的全量元素
首先我们意识到,把这些元素做风格化替换的工作流完全不一样。
所有被智驾系统感知到的3D元素(比如车辆、行人、栅栏、绿植、树干),需要走3D替换工作流;感知不到的远处建筑、地面,可用预制模型/预制贴图;天空,则可通过替换skybox素材来实现。
此外,这里有一个分界线:有些元素必须严谨替换,有些可以自由发挥。
周围车辆、道路标线等元素,关系到智驾系统的行为决策——不能让风格化影响驾驶员对道路信息的判断。
而建筑、天空这些纯环境元素,创作空间就大得多,可以尽情发挥想象力。
拆分清楚后,各条线分头推进。但从哪里开始呢?
行业里也有人在探索AI主题座舱。但市面上的方案,绝大多数还停留在”文生2D”阶段——让AI生成一张漂亮的风格化图片,贴到界面上当背景。
于是我们又开始挑战——我们打算从3D模型开始。

阶段二:获得一致的模型

我们先尝试生成了一组折纸风格的3D模型。
单独看每个模型都不错,也在同一个主题的范围内。
但把它们往同一个场景里一放,总觉得哪儿不太对。

颜色五花八门,不知哪个是主调;有的模型只有一种颜色,有的又有好几种。

大卡车和路边垃圾桶用了同样的折痕,但真实世界中,这两样东西的体量差了十几倍。

生成出来的东西就像是不同比例、不同品牌的手办摆在了一起。

问题出在生成方式上。每个模型各自为政,各自定义自己的颜色、纹理,放在一起当然拧巴。得先有一个“主题”的整体调性立住,再让每个元素在这个调性下去生成。

我们搭了一套自动化的生成架构——输入一个主题词,通过标准化的提示词体系、资产生产流程,先确定这个主题的整体氛围、光影、色调和材质语言,再在这个大框架的约束下,同批次生成全量资产。

比如,当主题词是”希腊城邦”时,我们不会直接去生成一辆”希腊风格的车”,而是先用一段文字把这个主题的基调定死:

古典美学,追求结构上的绝对对称与比例。强调光影在柱廊间的流动。以精雕大理石构、青铜为主。立柱环绕,透出琉璃般的质感。富丽明快:以纯白、金、克莱因蓝、赭石为主色调。丝绸锦缎(挂毯):纹样繁复,包含宝相花(希腊化变形)、联珠纹、狩猎纹。

有了这段”主题声明”,接下来生成的所有东西——无论是轿车、大货车还是路边的护栏——都必须从”纯白、金、克莱因蓝”的调色盘里取色,都必须带上大理石或青铜的材质反光,连表面的装饰都得遵循绝对对称的古典美学。

这样,这个SR世界中的3D模型,基本满足了一致、和谐。

阶段三:释放想象力,从构建世界观开始

但紧接着又来了一个更深层的问题。
统一是统一了,可生成出来的东西怎么看都像是换了层皮。
我尝试生成航海风格,于是AI往常规轿车上加了船型的车顶灯。
石器时代主题也一样——SUV还是SUV的轮廓,只是车身包了一层木板和骨头;轿车还是轿车的比例,只是贴了块石头纹理;连摩托车都保持着现代的车架结构,只不过轮子换成了石轮。
问题出在思路上。
我们一直是“贴车衣”:拿着现代汽车的壳子,往上叠风格元素。这个思路天然就有天花板——叠再多元素,底子还是那辆现代汽车。石器时代的人类根本不知道”汽车”是什么东西,他们的世界里不应该出现任何现代载具的影子。
我们意识到:不要从车出发,从世界观出发。
先想清楚这个世界的基本设定——社会怎么运转的,用什么能源,物理法则是什么——然后从这些设定里推演出这个世界的载具应该长什么样。
还是拿石器时代举例。这个世界没有引擎、没有钢铁、没有橡胶轮胎。部落用猛犸骨和兽皮搭建棚屋,用粗木和藤条捆扎拖车,出行靠犀牛和猛犸一类的巨兽拖拽。
终于SUV对应的不再是一辆贴了木板的现代越野车,而是一座兽皮顶棚的原始人力轿架;大货车对应的是犀牛拖着的骨架货车;行人就是穿着兽皮、手持石矛的部落猎人。
每个元素都从这个世界的生存逻辑里长出来,而不是从现代世界硬套过去。
同样的思路用在”行星货运中枢”上也成立。一辆在小行星带跑货运的东西,怎么可能还有后视镜和橡胶轮胎?它应该是全封闭驾驶舱、圆盘状离子引擎,脚下是布满环形山的月球表面,头顶是漆黑的星幕。
想通这一层之后,我们的SR开始有了平行世界的魅力——和现实世界很不一样,但经得起你的仔细推敲,它们在那个主题构建下的世界中是自洽的。

落地-与无数个主题、细节作战

当设计产出满足了我们的审美标准,接下来要做的就是落地了。
视觉上主题是否自洽自立、美轮美奂;法规上是否有合规风险;功能上是否影响驾驶安全……中间有无数个主题要推敲、优化、取舍。
在项目落地初期,标准逐渐设立之前,一切都依靠我们自己的眼睛。评估、判断、打分每一个主题,是一条艰苦的道路,也是必经之路。
那段时间,每次拿起Pad“苛刻品味”回灌数据在不同主题下的细节效果,已经成了大家的潜意识行为。举一个例子:阴影。
在原本的SR模型中,我们通过“传统手工”搓出来两种不同的阴影:「侧向阴影」与「AO阴影」,来表达正确和沉浸的3D关系。
AI生成的3D模型自身不带阴影信息,而为AI模型手搓阴影,无疑是一项Mission Impossible。为此我们再次调整了AI的生产管路。在模型生成的同时伴生两组不同的映射阴影模型:一个动态的侧向阴影,保证AI生成的模型也能拥有生动的光线效果;一个静态的AO阴影,保证AI模型看起来落地而有立体感。
无阴影
添加两种正确投影
用户大概永远不会注意到这个细节。但如果缺了它,整个3D世界的真实感会瞬间崩掉。
类似的细节还有很多。在工程化落地的过程中,无数不起眼的细节通过AI去重构,从“量变”转向“质变”。

千人千面

周末带孩子看完F1,回家路上打开车机,发现SR已经悄悄变成了赛车主题——道路变成围着赞助商广告牌的赛道,两侧堆着红白相间的轮胎墙,周围的车全变成了低趴的方程式赛车和涂装张扬的拉力车。
除夕夜开车回家,路面悄悄铺上红毯,路灯变成灯笼,远处天际线绽开烟花。春天走沿海公路,路边开满樱花,花瓣随着车速飘落。你什么都没操作,车自己给了你一个惊喜。
AI主题SR,不是一个版本迭代里的某个feature,它是一种新的可能性——每个人的驾驶世界,都可以是独一无二的。 一千个用户,一千种审美,一千种当下的心情。
这就是我们想做的事。

//

文丨无川、道听途说

图 | 团队

感谢阅读到此的读者,

本文是我们将工作中实战的落地项目尝试转化为方法论分享的第一篇文章,如有任何疑问欢迎大家随时交流~

最后,感谢团队所有参与AI SR主题项目、以及为本篇文章添砖加瓦的的伙伴!

后续我们也将持续分享设计思考与实践洞察。