
如果你告诉一个2023年的人:未来的AI可以写代码、做PPT、生成视频、分析财报。
大多数人不会怀疑,因为这些听起来就是人工智能应该做的事情。
但如果你告诉他:
有一家全球最大的咖啡连锁企业,投入重金部署AI系统,最后却发现它连货架上的咖啡杯都数不明白,很多人可能会觉得这是个笑话,可这偏偏是真事。
最近,星巴克宣布停止使用一套AI库存管理系统,按照最初的设想,这套系统能够通过摄像头和计算机视觉技术自动识别门店库存:牛奶还剩多少?糖浆还剩多少?纸杯还剩多少?员工只需要拿着设备扫描货架,系统就能自动完成统计。

这听起来像是一个非常合理的应用场景,毕竟今天的AI已经能写文章、写代码、做商业分析。
数几个杯子,总不会比写程序更难吧???
然而现实给出了完全相反的答案:系统频繁出现识别错误,有时候认不出商品,有时候统计数量不准确,有时候甚至需要员工重新核对,最终,星巴克选择放弃这套系统。
看到这里,我脑子里冒出了一个问题:
为什么AI能写代码,却数不好咖啡杯?
如果认真思考这个问题,你会发现它背后藏着一个被很多人忽略的事实:AI最难解决的,可能从来不是智力问题,而是现实问题。
很多人对AI有一个天然误解,我们总觉得AI最难的是思考,写文章、做决策、分析复杂问题,这些听起来都充满智力挑战,所以当ChatGPT出现时,很多人认为人工智能最大的突破发生了。
但对于AI工程师来说,另一件事往往更难:让AI准确理解现实世界。对于人类来说,一个咖啡杯就是一个咖啡杯,哪怕它被挡住一半,哪怕货架灯光昏暗,哪怕包装刚刚更新,我们依然能够轻松识别,因为人的大脑拥有强大的推理和补全能力。
但对于AI来说,事情完全不同,同样一个杯子,换个角度,换个光线,被其他商品挡住一部分,旁边多摆几个类似物品,系统识别结果就可能发生变化。
在人工智能领域有一个长期存在的现象:很多时候,感知世界比理解世界更困难。
今天的大模型已经能够完成复杂推理,但让它稳定地看懂一个杂乱无章的真实货架,依然是一项非常困难的任务。
这也是为什么自动驾驶发展了十多年依然没有全面普及,为什么机器人进入家庭的速度远低于许多人的预期,为什么很多智能仓储项目迟迟无法大规模复制,因为现实世界远比语言世界复杂。
文字是规则化的,现实是混乱的,而混乱,恰恰是AI最不擅长处理的东西。
事实上,星巴克遇到的问题并不特殊,过去几年,很多科技巨头都曾撞上同一堵墙,最典型的案例之一就是亚马逊无人商店。
当年亚马逊推出“拿了就走”的无人零售概念时,很多人认为这将彻底改变线下商业,顾客拿起商品直接离开,系统自动识别并完成扣款,整个过程不需要收银员,这个想法看起来无比美好。
但真正落地后,问题远比想象中复杂,商品会被顾客拿起又放回,会被放到错误的位置,会被遮挡,会出现各种意想不到的行为,为了保证系统稳定运行,亚马逊不得不投入大量硬件和运营成本。

自动驾驶也是类似的故事,如果你看过自动驾驶演示视频,会觉得技术已经非常成熟:识别车辆、识别红绿灯、自动变道、自动停车,很多场景几乎接近完美。
但真正困难的从来不是正常情况,而是那些极少发生的特殊情况:暴雨天气、施工路段、被遮挡的交通标志、突然冲出的行人。
这些低概率事件,恰恰决定了一套系统能否真正投入使用,对于自动驾驶来说,99%的正确率可能依然不够,因为剩下的1%,可能意味着事故。

机器人行业同样如此,让机器人在实验室里完成任务并不困难,但让机器人进入家庭,却是另一回事,因为每一个家庭都是不同的:家具布局不同、灯光不同、生活习惯不同、物品摆放方式也不同,对于机器人来说,每一个家庭几乎都是一个全新的世界。
看到这里,你会发现一个有趣的规律,过去几年发展最快的AI产品,几乎全部来自数字世界:ChatGPT处理文字、Claude处理文档、Cursor处理代码、Midjourney生成图片、AI客服处理用户问题。
这些产品有一个共同特点:它们面对的是数字化信息,输入是数字的,输出也是数字的,整个过程都发生在计算机内部:环境稳定、规则明确、数据标准。
而星巴克库存管理面对的却是现实世界,现实世界有三个特点:
第一,环境不断变化
第二,信息永远不完整
第三,人类行为无法预测
这三个特点恰恰构成了AI落地最大的障碍,很多人原本以为AI革命会率先发生在工厂、发生在仓库、发生在线下门店。
结果现实却完全相反,AI最先改变的不是工厂,而是办公室;最先改变的不是货架,而是Word文档;最先改变的不是流水线,而是电脑屏幕。
原因很简单,数字世界远比现实世界容易处理,如果说过去几年AI最大的突破是什么,那不是模型变得越来越聪明,而是人们终于发现:让AI理解语言,远比让AI理解现实容易。
这也是为什么越来越多企业开始重新审视自己的AI战略,过去两年,企业最关心的问题是:“我们有没有AI?”,很多公司把部署AI视为一种先进性的象征,但这种阶段正在结束。
现在越来越多企业开始关心另一个问题:“AI到底创造了多少价值、能不能节省成本?能不能提升效率?能不能增加收入?能不能稳定运行?“
如果这些问题回答不了,那么再先进的技术也很难获得持续投入,从这个角度看,星巴克关闭的并不仅仅是一个AI项目,它更像是一个信号:企业AI正在从概念验证阶段进入价值验证阶段。
过去大家讨论的是:AI能不能做,未来大家讨论的是:AI值不值得做,AI行业正在从技术竞赛进入ROI竞赛,未来最有价值的公司,未必拥有最强大的模型,但一定拥有最稳定的商业闭环。
很多人以为,AI革命最大的障碍是模型还不够聪明,但星巴克的案例告诉我们:模型越来越聪明了。
真正的问题是,现实世界从来都不按模型的逻辑运行:咖啡杯会被挡住、商品会被摆错、员工会临时调整货架、顾客会做出意料之外的行为,现实世界充满例外。
而AI最不擅长处理的,恰恰是例外,所以未来几年,最成功的AI公司未必是模型最强的公司,而是最懂现实世界的公司,当星巴克发现AI连咖啡杯都数不好的时候,它暴露的不只是一个项目的问题。它暴露的是整个AI产业正在面对的终极挑战:
让AI变聪明很难,但让AI适应现实世界,更难。
但一旦有人解决了这个问题,价值也会远远超过写文章和做PPT。
谁能让AI看懂货架
谁就有机会重构零售
谁能让AI看懂道路
谁就有机会重构交通
谁能让AI看懂工厂
谁就有机会重构制造业
下一代AI,改变的可能是整个现实世界。
作者/Amber(人类) CC(AI)
编辑/LLA(人类)

夜雨聆风