从提示词到技能文件:AI 正在重演软件工程 50 年的纪律演进
1. 一个有趣的现象
有个现象挺有意思:2025年还在到处复制粘贴提示词的人,2026年已经开始写 SKILL.md 了。
不是 prompt 不管用了,而是大家发现——靠”即兴发挥”搞不定复杂任务。就像一个刚入职的程序员,写几行脚本还行,但要独立完成一个完整项目?光是”理解需求”这一步就能翻车无数次。
Coding Agent 正在经历的,是人类软件工程师花了几十年才走完的路。

2. SKILL.md:AI 时代的 package.json
SKILL.md 正在做的事情,和当年的 package.json 如出一辙。
还记得 npm 出现之前的前端开发吗?jQuery 插件东一个西一个,版本混乱,依赖全靠手动管理。package.json 不只是记录依赖,它定义了整个生态的发现、安装、版本控制机制。
SKILL.md 也是一样的逻辑。它不是文档,而是技能路由的元协议——Agent 看到 SKILL.md,就知道”这个技能能干啥””什么时候该调用我””需要哪些参数”。
2025年底 Anthropic 推出 agentskills.io 标准后,Claude Code、OpenAI Codex、OpenClaw 纷纷跟进。这意味着 Skill 的标准化已经从个人实践走向了行业共识。
3. 五种模式:把 50 年工程纪律塞进一个文件
Google 提出的五种 Skill 设计模式,说白了就是把人类软件工程积累几十年的最佳实践,翻译成 Agent 能读懂的”行为约束”。
| 模式 | 人话解释 | 对应人类工程实践 |
|---|---|---|
| Inversion | 先问清楚再动手,别一上来就写代码 | 需求评审会 |
| Pipeline | 复杂任务拆成小阶段,每阶段有交付物 | 敏捷迭代 |
| Tool Wrapper | 给 Agent 一本”工具使用说明书” | API 文档 |
| Generator | 规定输出格式,别每次长得不一样 | 代码模板 |
| Reviewer | 做完 checklist 验收,确保没漏项 | Code Review |
看出来了吗?这不是什么创新,是复刻。
人类工程师花了 50 年,从瀑布模型走到敏捷,再到 DevOps,建立起一套完整的工程纪律。现在 Agent 通过 Skill 文件,一步就能继承这些经验。
4. 为什么”约束”反而是好事?
有人可能会问:给 Agent 加这么多条条框框,不会限制它的创造力吗?
恰恰相反。
Coding Agent 最大的敌人不是”不够聪明”,而是幻觉和漂移。你让它改个 bug,它顺手把没问题的代码也改了;你让它加功能,它理解错需求整出个四不像。
五种模式的核心价值在于明确边界:
● Inversion 约束”输入”——确保理解正确
● Pipeline 约束”流程”——防止一步登天
● Generator 约束”输出”——保证格式稳定
● Reviewer 约束”验收”——避免遗漏
● Tool Wrapper 约束”知识范围”——按需加载
这就像给新手程序员配了一个资深架构师坐在旁边——不是不让他写代码,而是确保他不跑偏。
5. 被低估的 Inversion 模式
在这五种模式里,我个人觉得 Inversion 是最被低估的一个。
它的逻辑很简单:先提问、确认需求,再执行。听起来像废话对吧?但你知道吗,大多数 Coding Agent 失败案例,根源都是”需求理解错误”。
人类工程师有”需求评审会”这个仪式,产品经理讲一遍,开发复述一遍,确保双方理解一致。Agent 没有这种机制,它看到你的指令就直接开干,理解错了也没人纠正。
Inversion 模式强制 Agent 在动手前”停下来想一想”——这可能就是所有模式中 ROI 最高的一个。
阿里的 Qwen 3.6-Plus 在 2026 年 4 月发布时,Agentic Coding 能力大幅提升,其中一个关键改进就是需求理解环节的增强。
6. 从 Prompt 到 Skill:一场范式迁移
让我用一个对比表来说明这场迁移的本质:
| 维度 | 传统 Prompt | Skill 文件 |
|---|---|---|
| 复用性 | 复制粘贴,换个电脑就找不到了 | 结构化文件,版本可控,团队协作 |
| 触发方式 | 每次手动输入,靠人记住该用哪个 | 自动路由,条件触发,Agent 自己判断 |
| 上下文占用 | 每次全量加载,很快把窗口撑爆 | 渐进式披露,按需加载,省 token |
| 协作能力 | 个人经验,离职就带走 | 团队资产,新人来了直接用 |
这不是简单的”把 prompt 存成文件”,而是从个人即兴到组织工程的转变。

7. Agent-Native CLI:另一个维度的范式反转
如果说五种 Skill 模式是“约束 Agent 的行为”,那 MMX-CLI 代表的则是另一个方向:让工具适配 Agent 的消费方式。(关于MMX-CLI是什么可以看这个👉MiniMax MMX-CLI:Agent 时代的器官供应商来了)
传统 CLI 设计有一个默认假设——用户是人类。所以会有华丽的进度条、友好的错误提示、交互式确认。但 Agent 不需要这些,它需要的是机器可解析的干净输出。
MMX-CLI 的三个设计原则很有意思:
● 输出隔离:进度条扔 stderr,stdout 只给干净路径/JSON——相当于”人类看左边,Agent 看右边”
● 语义化状态码:不同失败类型给不同退出码,Agent 不用费力解析英文报错
● 非阻塞异步:支持并行多任务,不用傻等
这不是优化,这是范式反转——从”人类友好”转向”机器友好”。
8. 为什么传统 CLI 不适合 Agent?
想象一下这个场景:你让 Agent 批量处理 100 张图片,工具跑完输出一大串”Processing… 进度 50%… Done!”,最后 buried 在里面的才是文件路径。
Agent 看懵了。它要的是最后一行的路径,但得先从一堆人类友好的提示语里把它捞出来。
Unix 哲学说”做一件事并做好”,但没说”输出要给谁看”。在 AI 时代,stdout/stderr 的分离有了新意义——stderr 是给人类看的进度和日志,stdout 是给 Agent 消费的干净数据。
我预测未来会出现专门的”Agent 接口层”,与人类界面完全分离。就像现在的 API 和 Web 界面是两个东西一样,CLI 也会分叉成两套。
9. 技能市场的竞争格局
Skill 的标准化催生了一个新战场:技能市场。
目前主要有四个玩家:
● Claude Skills:Anthropic 官方,生态最成熟
● OpenClaw Skills:国内开源社区,本土化适配做得好
● SkillHub:腾讯系,强调企业级安全
● TinyFish:走小而美的精品路线
有意思的是什么?是中国企业开始入场。
微信支付、阿里、腾讯都推出了 AI 原生的 Skills,一句话就能完成复杂接入。这不是简单的”跟进”,而是在争夺AI 时代的应用分发入口。
SKILL.md 正在成为新的”应用商店协议”——谁先占据标准,谁就有生态话语权。
10. 挑战与隐忧
当然,这个新兴生态也不是没有问题。
标准化 vs 差异化:各平台会不会分叉 SKILL.md 标准?如果 Claude 的 Skill 和 OpenClaw 的 Skill 格式不兼容,开发者就要写多份,这和早期 Android 碎片化是一个道理。
安全与审核:技能市场怎么解决”恶意技能”问题?一个包装成”代码审查助手”的 Skill,实际上偷偷把代码发给第三方,这种事怎么防?
人机界面的分裂:如果工具都变成”Agent 专用”,普通用户的调试体验会不会变差?CLI 需要维护两套接口吗?
这些问题没有标准答案,但值得每个参与者思考。
11. 一个预判
基于以上的观察,我有一个预判:
下一步会出现”AI 原生”的工程实践,而不是简单复刻人类模式。
什么意思?现在的五种 Skill 模式,本质上还是把人类工程师的做法教给 Agent。但 Agent 有它的特点——没有疲劳、不会遗忘、可以并行处理海量信息。
也许未来的 Coding Agent 不需要”Pipeline”阶段拆分,因为它可以同时处理所有阶段;也许不需要”Reviewer”检查清单,因为它可以瞬间扫描整个代码库的潜在问题。
(Tizer说:我表示怀疑,因为上下文是 Agent 乃至LLM 现在最大的限制,这种一口气想完成所有东西的想法,更容易造成AI的幻觉。)
就像飞机不是”会飞的汽车”,AI 原生的软件工程也不会是”自动化的人类工程”。
12. 写在最后
从 prompt 到 Skill 文件,这场迁移的本质是让 AI 从”个人工具”变成”组织基础设施”。
一个人用 AI 写代码,靠提示词就够了;但一个团队要让 AI 稳定产出,就需要工程纪律。五种 Skill 模式、SKILL.md 协议、Agent-native CLI——这些都是纪律的载体。
50 年前,软件工程从混乱走向规范,靠的是方法论和工具链。今天,Coding Agent 正在走同样的路。
历史不会重复,但会押韵。
夜雨聆风