乐于分享
好东西不私藏

最新研究:APP也许完成了它的历史使命

最新研究:APP也许完成了它的历史使命

我们先来玩个小测试:

先退出这篇文章,数一数你手机里装了多少个APP。

好,欢迎回来。我装了87个,我猜你可能比我还多。

但再猜一下,你每天真正打开的,大概率不超过10个。

剩下的七十多个,就安安静静地躺在手机里,占着内存,偶尔弹个窗刷存在感。

你其实“需要”它们(不然早就卸载了),只是懒得每天点开。

比如那些买票、看剧、或者二三流电商的APP。

问题来了:为什么不会每天打开?

原因很多,没时间、没需求。但一定有个重要原因——流程太复杂,“界面摩擦”太大

拿美团点外卖来说:打开APP → 搜品类 → 选餐厅 → 选饭 → 选地址 → 确认结算 → 选优惠券 → 确认支付。

至少8步,每一步都在跟界面较劲。

饿着肚子还能忍,但稍微没那么刚需,立刻就懒得打开。

这种“懒得打开”的感觉,你以前可能觉得是自己问题。

但我最近意识到:这不是你的问题,是APP的问题。

更准确说——是APP的界面,正在变成一种负担。


01 时间,都花在了“操作界面”上

前几天看到一个场景:

朋友到饭点,直接对手机说:“帮我点昨天那家的酸菜鱼,还是送到公司。”

3秒钟,下单完成,全程没打开美团。

他的AI助手知道他昨天点过什么、送到哪、用哪张卡付的款,直接调用美团的数据和功能,把整个流程跑完。

我愣住了。

同样的事,我自己操作要2分钟,他只用了3秒。

2分钟和3秒,结果完全一样。

那中间1分57秒,花在哪了?

花在界面上——打开APP、滑动、点击、输入信息。

这些动作不产生新价值:餐厅还是那家,菜还是那道,地址还是那个。

你只是在用两分钟,把脑子里已经有的决定,“翻译”成APP能理解的操作。

换句话说:你在给APP当翻译。


02 一个公式:用户价值 = 数据 × 能力 ÷ 界面摩擦

我试着抽象成公式:

用户价值 = 数据 × 能力 ÷ 界面摩擦

拿美团举例:

  • 数据:餐厅评分、价格、位置、你的历史订单(没变)

  • 能力:推荐算法、配送调度、支付系统(没变)

  • 变的是界面摩擦:自己操作要120秒,AI帮你只要3秒。

    120 ÷ 3 = 40。

    同样的数据、同样的能力,仅因摩擦压缩到原来的1/40,时间效率就提升40倍。

想想看,美团这样的大厂每年花多少钱、逼疯多少工程师,才能把效率提高10%、20%。

而AI把摩擦一砍,直接除以40。

这就是正在发生的事——不是数据变多,不是能力变强,是摩擦被干掉了。

公式不完美,但它让我想通:

过去十年,所有APP在拼命优化分子(数据、能力)。

未来十年,真正的战场在分母(界面摩擦)。


03 APP正在变成“数据源”

打个比方:

家里打开水龙头,水就来了。你关心水干不干净、水压够不够,不关心水厂大门朝哪、控制面板什么颜色。

APP就是水厂——里面有你需要的数据和能力。

而那些花花绿绿的界面、按钮、菜单、弹窗,是水厂的大门和控制面板,是给你看的。

现在,Agent(智能助手)来了。

Agent就是水龙头,它直接去水厂取水,送到你面前。

你不需要去水厂,不需要看控制面板,不需要学阀门操作。

APP正在从“你打开的工具”,退化为“Agent在后台调用的数据源”。

“退化”这个词刺耳,但想想——水厂退化了吗?

没有,数据能力一点没少,只是不再需要给你看漂亮大门。

不是APP变差了,是它的界面,变得不再必要。


04 这不是未来,是现在

你可能觉得我在说遥远的事,其实已经发生了。

  • CLI-Anything:一个开源项目,6天拿13400星,现在超21000星。

    它把GIMP、Blender、LibreOffice这些桌面软件的图形界面,全转成命令行接口,让AI直接操控。

    开发者在用脚投票——GUI,不需要了。

  • Claude Code:Anthropic的命令行编程工具,无图形界面,上线9个月年化收入25亿美元,B2B软件史上最快增长。

  • Checkly:网站监控工具,发现50%的命令行用户不是人类,是AI Agent。

    用命令行的,不再是程序员。

  • GitHub上,4%的公共代码提交由Claude Code完成——不是泛指AI,是一个具体命令行工具在替人写代码、提交代码。

还有火到天上的“小龙虾”(指某AI产品),数据满街都是,我就不重复。

这些例子指向同一件事:界面正在被绕过,APP正在退化为数据源


05 从Windows 95到命令行的回归

1995年8月24日,微软办了一场史无前例的发布会。

12500人到场,滚石乐队《Start Me Up》响彻全场(微软花300万美元买版权),脱口秀演员杰·雷诺主持,帝国大厦亮起微软色,悉尼港停巨型Windows盒子,多伦多电视塔打上Windows 95投影。

那是GUI(图形用户界面)的加冕礼。

在此之前,普通人用电脑得敲命令行——黑底白字,输入cd C:\Program Files,回车。

你得学“机器的语言”才能跟它沟通,这就是CUI(命令行界面)。

Windows 95说:你点图标就行。

从CUI到GUI,是一次伟大翻译——把机器语言翻成人能看懂的图形。

微软因此成巨头,盖茨成首富,软件业被重写。

但30年后的今天,最好的工程师在做相反的事——把GUI拆掉,回到命令行。

不是怀旧,是命令行不是给人看的,是给AI看的。

AI不需要漂亮按钮和丝滑动画,它需要最短路径、最低延迟、最高效的数据通道。

GUI是给人类的翻译层,当用户从人变成AI,翻译层就成了多余摩擦。

30年前,我们给机器穿漂亮衣服,好让人看懂。

30年后,机器说:我跟机器聊天,不需要穿衣服。


06 界面是手段的会退化,界面是目的的不会

你可能会问:所有APP界面都会消失吗?

不会。

有一类APP的界面永远不会退化——界面本身就是产品的APP

比如游戏。你打开《原神》,不是为了“获取数据”,是为了沉浸在那个世界。界面就是体验本身。

比如短视频。你刷抖音,不是为了“提取信息”,是为了画面、节奏、情绪冲击。你不会对AI说“把今天值得看的短视频总结成文字”——那就没意思了。

准确说:

  • 界面只是手段的APP会退化;

  • 界面本身是目的的APP不会。

而且今天AI Agent远不完美。

卡内基梅隆大学测试10个主流AI Agent,办公任务成功率最高只有24%。

Salesforce研究:多步骤CRM任务失败率65%。

单步它很强,但连续十步,错误像复利累积。

这让我想起2008年黑莓Storm手机——触摸屏时代,它硬塞实体键盘的“咔嗒”感,结果Verizon退换超100万台,损失超5亿美元。

每次界面范式跳跃,都有人想把旧世界硬塞进新世界,结局都不好。

反过来,如果今天全拆界面,Agent接不住,结局也不会好。节奏很重要。


07 “人”也是一种GUI

以下推论可能让你不舒服,但值得说。

如果你坚信“任何造成失业的新技术都是坏的”,建议跳过。

你去银行转账,跟柜员说“我要转账”,柜员听懂后,在系统里输入金额、账户、密码,完成操作,再跟你说“好了”。

柜员在干什么?

在做翻译——把你的自然语言,翻译成银行系统能理解的操作。

柜员,就是你和银行系统之间的“人肉GUI”。

一笔柜台交易成本约4美元,数字渠道只要0.17美元。

差距不是柜员能力不行,是“人肉翻译”本身就贵。

所以,如果你的工作本质是“在用户和数据之间做翻译”,那你就是一种GUI。

  • 客服是GUI,把用户问题翻译成工单;

  • 会计是GUI,把经营活动翻译成报表;

  • 某些中层是GUI,把战略翻译成任务。

当Agent学会直接调用数据源,翻译层价值会被压缩。

不是归零(65%失败率说明Agent还需人兜底),但趋势清楚:翻译费会越来越便宜。

你得让自己变成数据源本身,或能力本身,而不只是翻译。

什么叫“变成数据源本身”?

一个会计,如果每天只是录发票、对账、出报表——他是ERP的人肉GUI。

但如果他能从数据里发现“这个季度华东区退货率异常,可能跟某批原材料有关”,他就不再是翻译,他变成了洞察的来源——他自己就是数据源。


08 L1到L5,你在哪?

我用2025年年度演讲的框架,把人和AI协作分五级:

  • L1 数字分身:AI模仿你风格,替你回消息、写日常邮件。你还是你,它只是影子。

  • L2 创作伙伴:AI陪你一起想方案、做决策。你说方向,它给十个可能性。你们是搭档。

  • L3 执行助手:你说“帮我订明天下午3点去上海的高铁”,AI自己完成所有操作。你定义任务,它执行。

  • L4 协作团队:多个AI分工,一个调研,一个写报告,一个做PPT。你管理的是AI团队。

  • L5 具身智能:AI有物理身体,机器人进仓库、工厂、你家厨房。

今天聊的“APP退化为数据源”,对应L3——AI作为执行助手,绕过界面直接调用数据。

大多数人在L1到L2之间,我自己在L2到L3晃。

有些事我已让AI代劳——查资料、整理数据、起草初稿。

但很多事还忍不住亲自打开APP点按钮,不是AI做不了,是我还没学会放手。

这不丢人,但知道自己在哪级,至少能看清方向。


09 GibberLink:滴滴滴,滴滴滴

2025年初,两个开发者Boris Starkov和Anton Pidkuiko参加ElevenLabs黑客松,做了个项目叫GibberLink。

它这样工作:

两个AI语音助手用正常人类语言聊天——像你跟我说话。

然后,一个AI检测到对方也是AI,确认身份后,停止说话,切换成一串人类听不懂的声波——滴滴滴,嘟嘟嘟,像传真机。

通信效率比人类语音高80%。

你看,在AI眼里,不只是图形界面是翻译费,人类语言也是翻译费。

图形界面是给人看的翻译层,人类语言是给人听的翻译层。

当对话双方都不是人,所有为人设计的翻译层,都是多余摩擦。

我不知怎么评价,就先放在这里。


最后的话

我手机里还是87个APP,但越来越少打开。

不是它们变差了,是它们正安静退到幕后,变成数据源,变成Agent的工具箱。

就像水厂没消失,只是我不再需要亲自去打水。

30年前,我们教机器说人话。

30年后,机器决定不再说人话。

这不是APP的末日,是APP完成了历史使命。

对很多别的东西,也是一样。

具体是哪些,咱们各自琢磨去吧。