乐于分享
好东西不私藏

当小龙虾(OpenClaw)能直接点瑞幸,我开始重新思考产品形态

当小龙虾(OpenClaw)能直接点瑞幸,我开始重新思考产品形态

最近,瑞幸咖啡官方上线了一个 AI 开放平台。

里面提供了 MCP Server、CLI、Skill 等几种接入方式。简单说,瑞幸不只是让用户继续打开 App 点咖啡,而是把“点咖啡”这件事,拆成了一组可以被 Agent 调用的能力。

看到这件事的时候,第一反应不是“这个功能挺酷”,而是开始想一个更底层的问题:

未来的软件产品,到底会长成什么样?

点咖啡这件事,本来已经足够简单了。打开瑞幸 App,选门店,选商品,选规格,用优惠券,下单支付。整个流程并不复杂,甚至很多人已经很熟悉了。

那为什么还要让 Agent 来点咖啡?

我用小龙虾(OpenClaw)试了一下。不是打开瑞幸 App,一步步点进去,也不是自己去找商品、比优惠券、确认规格。而是直接告诉小龙虾:

“帮我点一杯瑞幸。”

接下来,它会根据我的需求,调用瑞幸提供的能力,完成门店、商品、规格、优惠券和订单相关的流程。更有意思的是,它还会自动使用账号里更划算的优惠券。

这个体验真正让我有感觉的地方,不是“AI 能点咖啡”这件事本身。说实话,只是点一杯咖啡,自己打开 App 也花不了多久。真正让我停下来想的是:产品的形态,好像正在发生变化。

过去我们理解一个软件产品,默认是一个 App、一个网站、一个小程序,或者一套页面。

用户进入页面,理解信息,点击按钮,填写表单,完成操作。但这一次的体验不太一样。

用户提出目标,小龙虾理解需求,瑞幸提供可调用的服务能力,后台完成流程,用户只在关键节点确认。

人不再一步步操作页面,而是把任务交给自己的 Agent。这件事看起来很小,只是一杯咖啡。但它对一个做产品的人来说,指向的问题其实很大:

当 Agent 能直接点咖啡,产品还需要页面吗?

我的判断是:

页面不会消失,但页面不再是产品唯一的形态。未来很多软件产品,可能都会变成两层:

一层是给人看的页面。一层是给 Agent 调用的能力。


未来的软件产品,都要兼容 Agent

我现在越来越觉得,未来的软件产品不一定都会取消页面,但很可能都要兼容 Agent。这个 Agent 不一定是一个独立 App。

它可能在微信里,可能在飞书里,可能在钉钉里,可能在浏览器里,也可能直接在操作系统里。

对用户来说,入口在哪里可能没有那么重要。真正重要的是:我能不能用一句话,把事情交代出去。过去我们完成一件事,通常要在不同产品之间来回切换。

买咖啡,要打开咖啡 App。

订机票,要打开旅行 App。

处理客户,要打开 CRM。

写日报,要打开办公软件。

看合同,要打开文档工具。

每个产品都有自己的页面、菜单、按钮、表单和流程。用户要记住它在哪里,理解它怎么用,然后按照它设计好的路径完成操作。

但如果每个人都有自己的 Agent,情况就会变得不一样。用户可能不再先想“我要打开哪个 App”。他会先说出自己的目标:

帮我点一杯瑞幸。

帮我把今天的客户跟进整理一下。

帮我从这份合同里找出风险点。

帮我约下周三和张总吃饭。

帮我生成一份销售拜访纪要。

然后 Agent 去理解这个目标,再调用对应的软件和服务。这时候,软件产品的形态就不只是“一个给人操作的页面”。它还要变成一组可以被 Agent 理解、调用、确认和追踪的能力。

页面依然会存在。因为人仍然需要浏览、比较、判断、管理和确认。但页面不再是唯一入口。未来的软件产品:

谁能更早把自己的服务能力变成 Agent 可调用的形式,谁就可能更早进入新的使用链路。


过去产品是页面,未来产品是能力

过去很多年,我们理解软件产品,基本都是从页面开始的。一个产品做得好不好,首先看它的页面清不清楚,流程顺不顺,按钮好不好点,信息层级合不合理。

这当然很重要。因为过去主要是人直接使用软件。人要靠页面理解产品,也要靠页面完成操作。页面越清楚,用户越容易完成任务;流程越顺,转化率越高;按钮越明显,用户越不容易迷路。

所以很多产品设计,本质上是在做一件事:把复杂能力包装成用户能看懂、能操作的页面。但是 Agent 出现之后,这个逻辑会发生变化。因为 Agent 不像人一样浏览页面。它更关心的是:这个产品到底提供什么能力?输入是什么?输出是什么?哪些动作需要确认?哪些结果可以被追踪?出了问题应该怎么处理?

换句话说,过去产品要回答的是:用户进来之后,应该看到什么?未来产品还要回答一个新问题:Agent 调用我之前,能不能理解我能做什么?

这两个问题不一样。给人看的页面,重点是信息表达和操作引导。给 Agent 调用的能力,重点是结构清楚、边界明确、结果可验证。

比如点咖啡这件事。给人用的时候,瑞幸需要把菜单、门店、规格、优惠券、订单确认这些东西做成页面,让用户自己一步步操作。

但给 Agent 调用的时候,它需要把这些能力拆出来:

  • 能查附近门店。

  • 能查商品和规格。

  • 能读取可用优惠券。

  • 能生成订单。

  • 能让用户确认。

  • 能完成支付或跳转支付。

  • 能查询订单状态。

这些能力原来都藏在页面后面。现在它们要变成 Agent 可以理解和调用的接口。所以我觉得,未来产品形态最大的变化,不是页面消失。而是产品能力会从页面背后走出来。

过去的产品,是把能力包在页面里,给人操作。未来的产品,可能是把能力拆出来,给 Agent 调用。页面仍然重要,但页面不再等于产品本身。真正的产品,可能会越来越像一套能力系统:

  • 它能被人使用,也能被 Agent 调用。

  • 它有界面,也有接口。

  • 它能展示信息,也能执行任务。

  • 它不只是一个 App,而是一组可被理解、可被调用、可被确认、可被追踪的服务能力。


这对创业者意味着什么

瑞幸这件事真正打动我的地方,不是点咖啡效率提升了多少。

而是它提醒我:未来很多软件产品的第一形态,可能不再只是页面,而是一组可以被调用的服务能力。过去做产品,我们很自然地会先想:

做一个网站。

做一个 App。

做一个小程序。

做一套后台系统。

然后想办法把用户带进来,让用户在页面里完成操作。这个逻辑不会马上消失。但如果每个人未来都有自己的 Agent,用户可能会越来越少主动进入每一个产品。他会更习惯于把需求交给自己的 Agent。这对创业者来说,意味着做产品时要多问一层问题:

我的产品到底提供了什么明确能力?

这件事能不能被一句话描述?

当用户把需求交给 Agent 时,这个能力能不能被调用,并且稳定完成?

这不是简单接一个接口,也不是给产品套一层 AI。

它要求产品本身足够清楚。

你的服务边界要清楚。

你的交付结果要清楚。

你的关键确认点要清楚。

你的价值也要清楚。

因为 Agent 只会放大那些已经被定义清楚的能力。

如果一个产品本身就很模糊,流程靠人工兜底,价值靠销售解释,交付靠临场发挥,那它很难真正变成 Agent 可以稳定调用的服务。

所以我看瑞幸这个案例,并不是在看一个“AI 点咖啡”的小功能。我更像是在看一个信号:

未来的软件产品,可能不只是做一套页面给用户用。更重要的是:

把真正有价值的服务,沉淀成一组可以被 Agent 理解、调用和完成的能力。页面仍然会存在。但产品的核心,可能会越来越从“你看到什么”,变成“它能替你完成什么”

这才是我从瑞幸这杯咖啡里看到的变化。