星巴克的AI,甚至连咖啡杯都数不好!

如果你告诉一个2023年的人：未来的AI可以写代码、做PPT、生成视频、分析财报。

大多数人不会怀疑，因为这些听起来就是人工智能应该做的事情。

但如果你告诉他：

有一家全球最大的咖啡连锁企业，投入重金部署AI系统，最后却发现它连货架上的咖啡杯都数不明白，很多人可能会觉得这是个笑话，可这偏偏是真事。

最近，星巴克宣布停止使用一套AI库存管理系统，按照最初的设想，这套系统能够通过摄像头和计算机视觉技术自动识别门店库存：牛奶还剩多少？糖浆还剩多少？纸杯还剩多少？员工只需要拿着设备扫描货架，系统就能自动完成统计。

这听起来像是一个非常合理的应用场景，毕竟今天的AI已经能写文章、写代码、做商业分析。

数几个杯子，总不会比写程序更难吧？？？

然而现实给出了完全相反的答案：系统频繁出现识别错误，有时候认不出商品，有时候统计数量不准确，有时候甚至需要员工重新核对，最终，星巴克选择放弃这套系统。

看到这里，我脑子里冒出了一个问题：

为什么AI能写代码，却数不好咖啡杯？

如果认真思考这个问题，你会发现它背后藏着一个被很多人忽略的事实：AI最难解决的，可能从来不是智力问题，而是现实问题。

很多人对AI有一个天然误解，我们总觉得AI最难的是思考，写文章、做决策、分析复杂问题，这些听起来都充满智力挑战,所以当ChatGPT出现时，很多人认为人工智能最大的突破发生了。

但对于AI工程师来说，另一件事往往更难：让AI准确理解现实世界。对于人类来说，一个咖啡杯就是一个咖啡杯，哪怕它被挡住一半，哪怕货架灯光昏暗，哪怕包装刚刚更新，我们依然能够轻松识别，因为人的大脑拥有强大的推理和补全能力。

但对于AI来说，事情完全不同，同样一个杯子，换个角度，换个光线，被其他商品挡住一部分，旁边多摆几个类似物品，系统识别结果就可能发生变化。

在人工智能领域有一个长期存在的现象：很多时候，感知世界比理解世界更困难。

今天的大模型已经能够完成复杂推理，但让它稳定地看懂一个杂乱无章的真实货架，依然是一项非常困难的任务。

这也是为什么自动驾驶发展了十多年依然没有全面普及，为什么机器人进入家庭的速度远低于许多人的预期，为什么很多智能仓储项目迟迟无法大规模复制，因为现实世界远比语言世界复杂。

文字是规则化的，现实是混乱的，而混乱，恰恰是AI最不擅长处理的东西。

事实上，星巴克遇到的问题并不特殊，过去几年，很多科技巨头都曾撞上同一堵墙，最典型的案例之一就是亚马逊无人商店。

当年亚马逊推出“拿了就走”的无人零售概念时，很多人认为这将彻底改变线下商业，顾客拿起商品直接离开，系统自动识别并完成扣款，整个过程不需要收银员，这个想法看起来无比美好。

但真正落地后，问题远比想象中复杂，商品会被顾客拿起又放回，会被放到错误的位置，会被遮挡，会出现各种意想不到的行为，为了保证系统稳定运行，亚马逊不得不投入大量硬件和运营成本。

自动驾驶也是类似的故事，如果你看过自动驾驶演示视频，会觉得技术已经非常成熟：识别车辆、识别红绿灯、自动变道、自动停车，很多场景几乎接近完美。

但真正困难的从来不是正常情况，而是那些极少发生的特殊情况：暴雨天气、施工路段、被遮挡的交通标志、突然冲出的行人。

这些低概率事件，恰恰决定了一套系统能否真正投入使用，对于自动驾驶来说，99%的正确率可能依然不够，因为剩下的1%，可能意味着事故。

机器人行业同样如此，让机器人在实验室里完成任务并不困难，但让机器人进入家庭，却是另一回事，因为每一个家庭都是不同的：家具布局不同、灯光不同、生活习惯不同、物品摆放方式也不同，对于机器人来说，每一个家庭几乎都是一个全新的世界。

已关注

关注

重播分享赞

视频详情

看到这里，你会发现一个有趣的规律，过去几年发展最快的AI产品，几乎全部来自数字世界：ChatGPT处理文字、Claude处理文档、Cursor处理代码、Midjourney生成图片、AI客服处理用户问题。

这些产品有一个共同特点：它们面对的是数字化信息，输入是数字的，输出也是数字的，整个过程都发生在计算机内部：环境稳定、规则明确、数据标准。

而星巴克库存管理面对的却是现实世界，现实世界有三个特点：

第一，环境不断变化

第二，信息永远不完整

第三，人类行为无法预测

这三个特点恰恰构成了AI落地最大的障碍，很多人原本以为AI革命会率先发生在工厂、发生在仓库、发生在线下门店。

结果现实却完全相反，AI最先改变的不是工厂，而是办公室；最先改变的不是货架，而是Word文档；最先改变的不是流水线，而是电脑屏幕。

原因很简单，数字世界远比现实世界容易处理，如果说过去几年AI最大的突破是什么，那不是模型变得越来越聪明，而是人们终于发现：让AI理解语言，远比让AI理解现实容易。

这也是为什么越来越多企业开始重新审视自己的AI战略，过去两年，企业最关心的问题是：“我们有没有AI？”，很多公司把部署AI视为一种先进性的象征，但这种阶段正在结束。

现在越来越多企业开始关心另一个问题：“AI到底创造了多少价值、能不能节省成本？能不能提升效率？能不能增加收入？能不能稳定运行？“

如果这些问题回答不了，那么再先进的技术也很难获得持续投入，从这个角度看，星巴克关闭的并不仅仅是一个AI项目，它更像是一个信号：企业AI正在从概念验证阶段进入价值验证阶段。

过去大家讨论的是：AI能不能做，未来大家讨论的是：AI值不值得做，AI行业正在从技术竞赛进入ROI竞赛，未来最有价值的公司，未必拥有最强大的模型，但一定拥有最稳定的商业闭环。

很多人以为，AI革命最大的障碍是模型还不够聪明，但星巴克的案例告诉我们：模型越来越聪明了。

真正的问题是，现实世界从来都不按模型的逻辑运行：咖啡杯会被挡住、商品会被摆错、员工会临时调整货架、顾客会做出意料之外的行为，现实世界充满例外。

而AI最不擅长处理的，恰恰是例外，所以未来几年，最成功的AI公司未必是模型最强的公司，而是最懂现实世界的公司，当星巴克发现AI连咖啡杯都数不好的时候，它暴露的不只是一个项目的问题。它暴露的是整个AI产业正在面对的终极挑战：

让AI变聪明很难，但让AI适应现实世界，更难。

但一旦有人解决了这个问题，价值也会远远超过写文章和做PPT。

谁能让AI看懂货架

谁就有机会重构零售

谁能让AI看懂道路

谁就有机会重构交通

谁能让AI看懂工厂

谁就有机会重构制造业

下一代AI，改变的可能是整个现实世界。

作者/Amber（人类） CC(AI)

编辑/LLA（人类）