APP退场,AI真的能接住吗?
你有没有过这种感觉——明明是一件特别小的事,但一想到要打开某个APP、点好几下、等几秒,就突然不想干了?

我跟你说个真事儿。上个月我想取消一个视频会员。打开APP,点进“我的”,找到“会员中心”,看到一个大大的红色按钮写着“续费”,找了半天愣是没找到“取消”。又点进“账户设置”,翻到“订阅管理”,终于看到一行小小的灰色字——“取消自动续费”。点下去,弹出来一个对话框问“你确定吗?”,我再点确定。
全程不到一分钟。但那一分钟里,我脑子里只有一个想法:为什么这么简单的一件事,要让我绕这么多弯?
后来我干脆不取消了。多扣了一个月的钱,也懒得去退。
你说这是懒吗?我觉得不是。这是一种新的疲劳——我管它叫“操作疲劳”。
我们到底在给谁当翻译?
我后来琢磨了一件事。假如现在有一个助手,我只需要跟它说一句“帮我把那个会员取消了”,然后它就自己去找入口、走流程、点确认——半秒钟的事。
半秒和半分钟,结果完全一样。那中间那29秒,花在哪儿了?
花在界面上了。花在了“我要告诉一个完全不懂我的东西,怎么做一件我已经决定要做的事”这个过程上。
你脑子里已经有了判断:取消。但APP不懂,你得一步步教它:点这里、找那里、确认这个。
说白了,你在给它当翻译。
我试着用个公式来理解这件事。你从一件事里得到的价值,大概等于背后的能力,除以你付出的翻译成本。
背后的能力,是那些大厂花了十几年堆起来的东西——数据、算法、算力。这部分一直在涨。但翻译成本——你为了获取这些能力而必须做的操作——一直没怎么变。取消个会员还是那几步,订个票还是那几步,办个业务还是那几步。
AI来了之后,翻译成本被剧烈压缩了。因为它不需要界面。它可以直接跟后台对话,用机器的语言,完成机器该做的事。
过去十年,所有APP都在拼命堆能力。但接下来十年,真正的变化会发生在分母上。
APP正在变成水厂
我换个说法你就明白了。
你家里有水龙头。你关心水质好不好、水压够不够。但你关心水厂的大门朝哪开吗?水厂控制面板是什么颜色吗?不关心。
APP就是水厂。它里面有你需要的东西,但它非要让你先穿过它的大门、走过它的走廊、研究它的控制面板。
现在Agent来了,Agent就是水龙头。它直接从水厂取水,送到你面前。你不需要去水厂了。
APP正在从“你使用的工具”,变成“Agent在后台调用的水源”。
这听起来像APP被降级了。但水厂被降级了吗?水厂的能力一点没少,它只是不再需要那个给你看的大门了。
这不是APP变差了。是APP的界面,变得没必要了。
你想想,Spotify已经可以直接通过Siri播放,你连界面都不用看。Expedia接入了ChatGPT,你说句话就能订行程。Shopify的后台正在被各种购物助手调用,消费者可能根本不知道Shopify的存在。
界面正在悄悄退到幕后。
界面没了,但新的麻烦来了
当然,这不是一个“界面消失、世界通畅”的故事。历史告诉我们,每消除一层麻烦,就会在更高处长出新的麻烦。
命令行时代,麻烦是记指令。你得背一堆cd、ls、mkdir。GUI时代,麻烦变成了找按钮。你不记指令了,但得在菜单里翻来翻去。
到了AI时代,旧麻烦在消失,新麻烦已经冒出来了。
第一个是信任麻烦。你敢让Agent自动付钱吗?绕过所有界面直接完成交易,听起来方便,但万一它搞错了呢?万一它被攻击了呢?方便和失控之间的那条线,你得自己画。
第二个是意图麻烦。你真的知道自己想要什么吗?你对Agent说“帮我找个好吃的”——这句话里的模糊性,可能比点十下按钮更让人头疼。界面时代,选项是有限的,你只需要选。但到了意图时代,你得先想清楚自己要什么。
第三个是责任麻烦。Agent搞砸了,谁负责?指令是你下的,但执行是它。界面消失的同时,追责的边界也模糊了。你跟谁理论?跟APP?跟Agent?还是跟自己?
这些新麻烦不会阻止变化,但会决定变化长什么样。接下来几年的竞争,比的可能不是“谁把界面消除得更彻底”,而是“谁在消除旧麻烦的同时,能把新麻烦处理得更优雅”。
为什么我们绕了一圈又回来了?
说一个30年前的事儿。
1995年,微软发布Windows 95。那是图形界面的登基典礼。在此之前,普通人用电脑得敲命令行——你得学电脑的语言。Windows 95说:不用学了,你点图标就行。
那是一次伟大的翻译:把机器的语言,翻译成人能看懂的图形。
30年后,最好的工程师们在做相反的事:把图形界面拆掉,回到命令行。
不是因为他们怀旧。是因为命令行不是给人看的,是给AI看的。AI不需要漂亮的按钮和丝滑的动画。它需要最短的路径、最低的延迟、最高效率的数据通道。
图形界面是给人类的翻译层。当用户从人变成AI,翻译层就成了多余的东西。
30年前,我们给机器穿上衣服,好让人看懂。30年后,机器说:我跟机器聊天,不需要穿衣服。
你可能觉得这是少数极客的癖好。但数据不骗人。
有一个叫CLI-Anything的开源项目,能把图形软件转成命令行,6天就拿到了13400颗星,现在超过21000颗。开发者们在用脚投票。
还有Claude Code,Anthropic出的命令行编程工具,没有图形界面,就是一个终端窗口。上线9个月,年化收入25亿美元。这是B2B软件史上最快的增长速度。
Checkly这个网站监控工具,发现自己50%的命令行用户不是人类——是AI Agent。用命令行的,不再是程序员了。
GitHub上,4%的公共代码提交,是由Claude Code完成的。不是泛指AI,是一个具体的命令行工具,在替人类写代码、提交代码。
这些数据指向同一件事:界面正在被绕过。
人也是界面
下面这段话可能会让你不太舒服。如果你觉得任何造成失业的技术都是不好的,可以跳过。
你去银行,跟柜员说:“我要转账。”柜员听懂你的话,转身在系统里输入账号、金额、密码,再转回来说:“好了。”
柜员在做什么?在翻译。把你的自然语言,翻译成银行系统能理解的操作。
柜员,就是你和银行系统之间的“人肉界面”。
一笔柜台交易的成本,大约4美元。同样一笔交易通过APP完成,成本0.17美元。这4美元的差距,不是柜员能力不行,是“人肉翻译”本身就贵。
如果你的工作本质是“在用户和数据之间做翻译”,那你就是一种界面。客服是界面,会计是界面,某些中层管理者也是界面。
当Agent学会直接调用数据源,翻译层的价值就会被压缩。不是归零——现在Agent在多步骤任务里的失败率还有65%——但趋势是清楚的:翻译这件事,会越来越不值钱。
但这不意味着这些岗位会消失。它们会变。
美国银行做过一件事。当ATM和APP取代了大部分基础交易后,他们留下来的柜员被培训成了“金融健康顾问”。不是帮你转账,是帮你分析“为什么你每个月到20号就没钱了”。他们从“翻译”变成了“洞察”。
你得让自己变成数据源,或者变成能力本身。而不只是翻译。
什么叫变成数据源?一个会计,如果每天只是录入发票、对账、出报表——他就是ERP系统的“人肉界面”。但如果他能从数据里发现“这个季度华东区的退货率异常偏高,可能跟某批原材料有关”,他就不再是翻译了。他变成了洞察的来源。他自己就是数据源。
你在哪一级?
我试着把人跟AI的协作分成五级,你可以看看自己在哪。
第一级,影子。AI替你回消息、写日常邮件。你是你,它是影子。
第二级,搭档。你说方向,它给可能性。你们是搭档。
第三级,执行者。你说“帮我订明天下午三点去上海的高铁”,AI自己完成所有操作。你定任务,它执行任务。
第四级,团队。多个AI分工协作,一个调研,一个写报告,一个做PPT。你管理的不是人,是一支AI团队。
第五级,身体。AI有了物理身体,机器人走进仓库、工厂、你家厨房。
今天我们聊的“APP退化成数据源”,对应的是第三级——AI作为执行者,绕过界面,直接调用数据。
大多数人现在在第一级和第二级之间。你在哪?
说实话,我也还在第二级到第三级之间晃。有些事已经让AI代劳了,但很多事还是忍不住自己来。不是AI做不了,是还没习惯放手。这不丢人。但知道自己在哪一级,至少能看清方向。
而且每一级升级,都会带来新的麻烦——从操作麻烦,变成意图麻烦、信任麻烦、责任麻烦。
当AI不再说人话
最后,跟你说一件有意思的事儿。
2025年初,两个开发者在一次黑客松上做了一个项目叫GibberLink。
两个AI语音助手在对话。一开始,它们用正常的人类语言聊天。然后,其中一个AI检测到对面也是AI。它们确认了彼此的身份。接着,它们不说话了。对话切换成了一串人类完全听不懂的声波——滴滴滴,嘟嘟嘟,像传真机一样的声音。通信效率比人类语音高80%。
你看,在AI眼里,不只是图形界面是多余的翻译层。人类语言,也是多余的翻译层。
图形界面是给人看的翻译层。人类语言是给人听的翻译层。当对话双方都不是人的时候,所有为人类设计的翻译层,都是多余的。
我不知道该说这是进步还是别的什么。就先放在这里吧。
我手机里还是那些APP。但越来越少打开了。不是它们变差了——是它们正在退到幕后,变成数据源,变成Agent的工具箱。就像水厂没有消失,只是我不再需要亲自去水厂打水了。
30年前,我们教机器说人话。30年后,机器决定不再说人话了。
这不是APP的末日。是APP完成了它的历史使命。
但有个问题值得琢磨:当所有的水龙头都通向同一个水厂,水价谁来定?当Agent成为我们和数字世界之间的唯一通道,这个Agent听命于谁?是我们控制的工具,还是替我们做决定的管家?
界面消失了,权力去了哪里?
这个问题,比界面本身更值得想。
夜雨聆风