乐于分享
好东西不私藏

从提示词到技能文件:AI 正在重演软件工程 50 年的纪律演进

从提示词到技能文件:AI 正在重演软件工程 50 年的纪律演进

1. 一个有趣的现象

有个现象挺有意思:2025年还在到处复制粘贴提示词的人,2026年已经开始写 SKILL.md 了。

不是 prompt 不管用了,而是大家发现——靠”即兴发挥”搞不定复杂任务。就像一个刚入职的程序员,写几行脚本还行,但要独立完成一个完整项目?光是”理解需求”这一步就能翻车无数次。

Coding Agent 正在经历的,是人类软件工程师花了几十年才走完的路。

2. SKILL.md:AI 时代的 package.json

SKILL.md 正在做的事情,和当年的 package.json 如出一辙。

还记得 npm 出现之前的前端开发吗?jQuery 插件东一个西一个,版本混乱,依赖全靠手动管理。package.json 不只是记录依赖,它定义了整个生态的发现、安装、版本控制机制。

SKILL.md 也是一样的逻辑。它不是文档,而是技能路由的元协议——Agent 看到 SKILL.md,就知道”这个技能能干啥””什么时候该调用我””需要哪些参数”。

2025年底 Anthropic 推出 agentskills.io 标准后,Claude Code、OpenAI Codex、OpenClaw 纷纷跟进。这意味着 Skill 的标准化已经从个人实践走向了行业共识。

💡 核心论点:SKILL.md 的落地标志着 AI 技能从”手工作坊”进入了”工业化生产”阶段。

3. 五种模式:把 50 年工程纪律塞进一个文件

Google 提出的五种 Skill 设计模式,说白了就是把人类软件工程积累几十年的最佳实践,翻译成 Agent 能读懂的”行为约束”。

模式 人话解释 对应人类工程实践
Inversion 先问清楚再动手,别一上来就写代码 需求评审会
Pipeline 复杂任务拆成小阶段,每阶段有交付物 敏捷迭代
Tool Wrapper 给 Agent 一本”工具使用说明书” API 文档
Generator 规定输出格式,别每次长得不一样 代码模板
Reviewer 做完 checklist 验收,确保没漏项 Code Review

看出来了吗?这不是什么创新,是复刻

人类工程师花了 50 年,从瀑布模型走到敏捷,再到 DevOps,建立起一套完整的工程纪律。现在 Agent 通过 Skill 文件,一步就能继承这些经验。

4. 为什么”约束”反而是好事?

有人可能会问:给 Agent 加这么多条条框框,不会限制它的创造力吗?

恰恰相反。

Coding Agent 最大的敌人不是”不够聪明”,而是幻觉和漂移。你让它改个 bug,它顺手把没问题的代码也改了;你让它加功能,它理解错需求整出个四不像。

五种模式的核心价值在于明确边界

Inversion 约束”输入”——确保理解正确

Pipeline 约束”流程”——防止一步登天

Generator 约束”输出”——保证格式稳定

Reviewer 约束”验收”——避免遗漏

Tool Wrapper 约束”知识范围”——按需加载

这就像给新手程序员配了一个资深架构师坐在旁边——不是不让他写代码,而是确保他不跑偏。

5. 被低估的 Inversion 模式

在这五种模式里,我个人觉得 Inversion 是最被低估的一个。

它的逻辑很简单:先提问、确认需求,再执行。听起来像废话对吧?但你知道吗,大多数 Coding Agent 失败案例,根源都是”需求理解错误”。

人类工程师有”需求评审会”这个仪式,产品经理讲一遍,开发复述一遍,确保双方理解一致。Agent 没有这种机制,它看到你的指令就直接开干,理解错了也没人纠正。

Inversion 模式强制 Agent 在动手前”停下来想一想”——这可能就是所有模式中 ROI 最高的一个。

阿里的 Qwen 3.6-Plus 在 2026 年 4 月发布时,Agentic Coding 能力大幅提升,其中一个关键改进就是需求理解环节的增强。

6. 从 Prompt 到 Skill:一场范式迁移

让我用一个对比表来说明这场迁移的本质:

维度 传统 Prompt Skill 文件
复用性 复制粘贴,换个电脑就找不到了 结构化文件,版本可控,团队协作
触发方式 每次手动输入,靠人记住该用哪个 自动路由,条件触发,Agent 自己判断
上下文占用 每次全量加载,很快把窗口撑爆 渐进式披露,按需加载,省 token
协作能力 个人经验,离职就带走 团队资产,新人来了直接用

这不是简单的”把 prompt 存成文件”,而是从个人即兴到组织工程的转变。

7. Agent-Native CLI:另一个维度的范式反转

如果说五种 Skill 模式是“约束 Agent 的行为”,那 MMX-CLI 代表的则是另一个方向:让工具适配 Agent 的消费方式。(关于MMX-CLI是什么可以看这个👉MiniMax MMX-CLI:Agent 时代的器官供应商来了

传统 CLI 设计有一个默认假设——用户是人类。所以会有华丽的进度条、友好的错误提示、交互式确认。但 Agent 不需要这些,它需要的是机器可解析的干净输出

MMX-CLI 的三个设计原则很有意思:

输出隔离:进度条扔 stderr,stdout 只给干净路径/JSON——相当于”人类看左边,Agent 看右边”

语义化状态码:不同失败类型给不同退出码,Agent 不用费力解析英文报错

非阻塞异步:支持并行多任务,不用傻等

这不是优化,这是范式反转——从”人类友好”转向”机器友好”。

8. 为什么传统 CLI 不适合 Agent?

想象一下这个场景:你让 Agent 批量处理 100 张图片,工具跑完输出一大串”Processing… 进度 50%… Done!”,最后 buried 在里面的才是文件路径。

Agent 看懵了。它要的是最后一行的路径,但得先从一堆人类友好的提示语里把它捞出来。

Unix 哲学说”做一件事并做好”,但没说”输出要给谁看”。在 AI 时代,stdout/stderr 的分离有了新意义——stderr 是给人类看的进度和日志,stdout 是给 Agent 消费的干净数据。

我预测未来会出现专门的”Agent 接口层”,与人类界面完全分离。就像现在的 API 和 Web 界面是两个东西一样,CLI 也会分叉成两套。

9. 技能市场的竞争格局

Skill 的标准化催生了一个新战场:技能市场。

目前主要有四个玩家:

Claude Skills:Anthropic 官方,生态最成熟

OpenClaw Skills:国内开源社区,本土化适配做得好

SkillHub:腾讯系,强调企业级安全

TinyFish:走小而美的精品路线

有意思的是什么?是中国企业开始入场

微信支付、阿里、腾讯都推出了 AI 原生的 Skills,一句话就能完成复杂接入。这不是简单的”跟进”,而是在争夺AI 时代的应用分发入口

SKILL.md 正在成为新的”应用商店协议”——谁先占据标准,谁就有生态话语权。

10. 挑战与隐忧

当然,这个新兴生态也不是没有问题。

标准化 vs 差异化:各平台会不会分叉 SKILL.md 标准?如果 Claude 的 Skill 和 OpenClaw 的 Skill 格式不兼容,开发者就要写多份,这和早期 Android 碎片化是一个道理。

安全与审核:技能市场怎么解决”恶意技能”问题?一个包装成”代码审查助手”的 Skill,实际上偷偷把代码发给第三方,这种事怎么防?

人机界面的分裂:如果工具都变成”Agent 专用”,普通用户的调试体验会不会变差?CLI 需要维护两套接口吗?

这些问题没有标准答案,但值得每个参与者思考。

11. 一个预判

基于以上的观察,我有一个预判:

下一步会出现”AI 原生”的工程实践,而不是简单复刻人类模式。

什么意思?现在的五种 Skill 模式,本质上还是把人类工程师的做法教给 Agent。但 Agent 有它的特点——没有疲劳、不会遗忘、可以并行处理海量信息。

也许未来的 Coding Agent 不需要”Pipeline”阶段拆分,因为它可以同时处理所有阶段;也许不需要”Reviewer”检查清单,因为它可以瞬间扫描整个代码库的潜在问题。

(Tizer说:我表示怀疑,因为上下文是 Agent 乃至LLM 现在最大的限制,这种一口气想完成所有东西的想法,更容易造成AI的幻觉。)

就像飞机不是”会飞的汽车”,AI 原生的软件工程也不会是”自动化的人类工程”。

12. 写在最后

从 prompt 到 Skill 文件,这场迁移的本质是让 AI 从”个人工具”变成”组织基础设施”

一个人用 AI 写代码,靠提示词就够了;但一个团队要让 AI 稳定产出,就需要工程纪律。五种 Skill 模式、SKILL.md 协议、Agent-native CLI——这些都是纪律的载体。

50 年前,软件工程从混乱走向规范,靠的是方法论和工具链。今天,Coding Agent 正在走同样的路。

历史不会重复,但会押韵。