Skill来了,App 要没了
上周我在写一个 Skill,写到一半停下来想了很久。
那个 Skill 大概 200 行文字,描述了一个「每次开会前自动整理资料」的流程。写完之后我发现——它和我以前写过的一个脚本几乎是同一件事。
只不过一个是代码,一个是中文。
这让我开始认真想一件事:如果 Agent 能读懂文字指令,我们还需要那么多 App 吗?
过去十年,普通用户接触软件的方式,基本上就是 App。
你有一个需求,就去找对应的 App。记笔记用 Notion,画图用 Figma。每个 App 背后是一套完整的产品逻辑:功能设计、用户界面、增长策略。大家讨论的问题,也一直是 App 怎么做得更好用,怎么获得更多用户。
Skill 这个东西,让我开始觉得这个问题值得认真对待了。
Skill 是一个 markdown 文件,里面写着指令:遇到什么情况,执行什么步骤,调用什么工具,输出什么格式。Agent 读完,就能照着做。
Skill 就是用文字写的功能模块。
它有输入有输出,可以模块化,可以复用。写代码要考虑性能,写 Skill 要考虑 token 消耗,逻辑差不多是一回事。
区别只有一个:代码文件是给机器读的,Skill 文件是给 Agent 读的。
有了大模型作为底座,文字,正在变成一种编程语言。

Agent 能走出对话框,靠两件事:MCP 和 Skill。
MCP 的全称是 Model Context Protocol,让 AI 接触外部世界的协议。以前 Agent 能做的事基本被限制在对话框里,有了 MCP,它就能连数据库、读本地文件、调用远程服务。可以把它理解成 AI 时代的 USB 接口——不管什么设备,插上就能用。它是开放协议,不是哪家公司的私有接口。
Github、Notion、Figma 都已经推出了自己的 MCP Server,这个名单还在变长。对这些公司来说,接入 MCP 就是在告诉用户:你可以直接通过 Agent 来用我的服务了。
Skill 是另一层能力。MCP 让 Agent 能碰到外部世界,Skill 解决的是另一个问题:怎么让 Agent 重复做一件复杂的事。一个写好的 Skill,可以让 Agent 去抓网页、生成图片、把内容发布到 X 或者微信公众号。经验和流程固定成文字,变成可以反复调用的模块。
把这些拼在一起,软件的结构开始变得不一样:最顶层是用户用自然语言表达的意图,往下是 Agent 负责理解和规划,再往下是 Skill 提供具体能力,然后是 MCP 连接外部服务,最底下才是数据库和 API 这些基础设施。

大模型本身会写代码,这件事让界面这个问题变得不一样了。过去做一个产品,要先想用户界面:按钮放哪里、流程怎么走、新用户怎么引导。用户当然在意界面,但每个人的审美和习惯不一样,一套设计没办法让所有人都顺手。
现在 Agent 自己就能生成界面,而且是按照每个用户自己的指令来的。一个完全照着自己习惯生成的界面,和一个为几千万人平均设计的界面,用起来的感受不会一样。公司只要把核心服务通过 MCP 或 Skill 暴露出来,剩下的事情用户自己就能搭。

但这条路现在还走不稳。
大模型是概率模型,同样的指令跑两次,结果可能不一样。代码只要逻辑对,运行结果是确定的。Skill 不是,Agent 有时候会理解偏,有时候会漏掉步骤。现阶段用 Skill 做关键业务,还是得留着人在旁边看。
商业化是另一道坎。Skill 现在是明文的 markdown 文件,谁都能看、能复制、能改。写得好的 Skill 和写得差的 Skill,用起来体验差很多,但没有任何机制能保护前者。
这最终大概得靠大模型厂商来解决,但现在还没有答案。
回到开头的问题:我们还需要那么多 App 吗?
我觉得不需要了。或者说,App 的竞争,慢慢会变成 Skill 的竞争。公司要思考的不再只是怎么把界面做好看,而是怎么把自己的服务包装成 Agent 能调用的形式,以及怎么从中赚到钱。
那一刻我意识到,可能不需要多少年,我们说的『软件』就不是现在这个意思了。
App 时代比的是产品力。Agent 时代比的是服务能不能被调用。这是两种完全不同的竞争。

你怎么看?
夜雨聆风