从提示词到技能文件:AI 正在重演软件工程 50 年的纪律演进-夜雨聆风

从提示词到技能文件:AI 正在重演软件工程 50 年的纪律演进

1. 一个有趣的现象

有个现象挺有意思：2025年还在到处复制粘贴提示词的人，2026年已经开始写 SKILL.md 了。

不是 prompt 不管用了，而是大家发现——靠”即兴发挥”搞不定复杂任务。就像一个刚入职的程序员，写几行脚本还行，但要独立完成一个完整项目？光是”理解需求”这一步就能翻车无数次。

Coding Agent 正在经历的，是人类软件工程师花了几十年才走完的路。

2. SKILL.md：AI 时代的 package.json

SKILL.md 正在做的事情，和当年的 package.json 如出一辙。

还记得 npm 出现之前的前端开发吗？jQuery 插件东一个西一个，版本混乱，依赖全靠手动管理。package.json 不只是记录依赖，它定义了整个生态的发现、安装、版本控制机制。

SKILL.md 也是一样的逻辑。它不是文档，而是技能路由的元协议——Agent 看到 SKILL.md，就知道”这个技能能干啥””什么时候该调用我””需要哪些参数”。

2025年底 Anthropic 推出 agentskills.io 标准后，Claude Code、OpenAI Codex、OpenClaw 纷纷跟进。这意味着 Skill 的标准化已经从个人实践走向了行业共识。

💡 核心论点：SKILL.md 的落地标志着 AI 技能从”手工作坊”进入了”工业化生产”阶段。

3. 五种模式：把 50 年工程纪律塞进一个文件

Google 提出的五种 Skill 设计模式，说白了就是把人类软件工程积累几十年的最佳实践，翻译成 Agent 能读懂的”行为约束”。

模式	人话解释	对应人类工程实践
Inversion	先问清楚再动手，别一上来就写代码	需求评审会
Pipeline	复杂任务拆成小阶段，每阶段有交付物	敏捷迭代
Tool Wrapper	给 Agent 一本”工具使用说明书”	API 文档
Generator	规定输出格式，别每次长得不一样	代码模板
Reviewer	做完 checklist 验收，确保没漏项	Code Review

看出来了吗？这不是什么创新，是复刻。

人类工程师花了 50 年，从瀑布模型走到敏捷，再到 DevOps，建立起一套完整的工程纪律。现在 Agent 通过 Skill 文件，一步就能继承这些经验。

4. 为什么”约束”反而是好事？

有人可能会问：给 Agent 加这么多条条框框，不会限制它的创造力吗？

恰恰相反。

Coding Agent 最大的敌人不是”不够聪明”，而是幻觉和漂移。你让它改个 bug，它顺手把没问题的代码也改了；你让它加功能，它理解错需求整出个四不像。

五种模式的核心价值在于明确边界：

● Inversion 约束”输入”——确保理解正确

● Pipeline 约束”流程”——防止一步登天

● Generator 约束”输出”——保证格式稳定

● Reviewer 约束”验收”——避免遗漏

● Tool Wrapper 约束”知识范围”——按需加载

这就像给新手程序员配了一个资深架构师坐在旁边——不是不让他写代码，而是确保他不跑偏。

5. 被低估的 Inversion 模式

在这五种模式里，我个人觉得 Inversion 是最被低估的一个。

它的逻辑很简单：先提问、确认需求，再执行。听起来像废话对吧？但你知道吗，大多数 Coding Agent 失败案例，根源都是”需求理解错误”。

人类工程师有”需求评审会”这个仪式，产品经理讲一遍，开发复述一遍，确保双方理解一致。Agent 没有这种机制，它看到你的指令就直接开干，理解错了也没人纠正。

Inversion 模式强制 Agent 在动手前”停下来想一想”——这可能就是所有模式中 ROI 最高的一个。

阿里的 Qwen 3.6-Plus 在 2026 年 4 月发布时，Agentic Coding 能力大幅提升，其中一个关键改进就是需求理解环节的增强。

6. 从 Prompt 到 Skill：一场范式迁移

让我用一个对比表来说明这场迁移的本质：

维度	传统 Prompt	Skill 文件
复用性	复制粘贴，换个电脑就找不到了	结构化文件，版本可控，团队协作
触发方式	每次手动输入，靠人记住该用哪个	自动路由，条件触发，Agent 自己判断
上下文占用	每次全量加载，很快把窗口撑爆	渐进式披露，按需加载，省 token
协作能力	个人经验，离职就带走	团队资产，新人来了直接用

这不是简单的”把 prompt 存成文件”，而是从个人即兴到组织工程的转变。

7. Agent-Native CLI：另一个维度的范式反转

如果说五种 Skill 模式是“约束 Agent 的行为”，那 MMX-CLI 代表的则是另一个方向：让工具适配 Agent 的消费方式。（关于MMX-CLI是什么可以看这个👉MiniMax MMX-CLI：Agent 时代的器官供应商来了）

传统 CLI 设计有一个默认假设——用户是人类。所以会有华丽的进度条、友好的错误提示、交互式确认。但 Agent 不需要这些，它需要的是机器可解析的干净输出。

MMX-CLI 的三个设计原则很有意思：

● 输出隔离：进度条扔 stderr，stdout 只给干净路径/JSON——相当于”人类看左边，Agent 看右边”

● 语义化状态码：不同失败类型给不同退出码，Agent 不用费力解析英文报错

● 非阻塞异步：支持并行多任务，不用傻等

这不是优化，这是范式反转——从”人类友好”转向”机器友好”。

8. 为什么传统 CLI 不适合 Agent？

想象一下这个场景：你让 Agent 批量处理 100 张图片，工具跑完输出一大串”Processing… 进度 50%… Done!”，最后 buried 在里面的才是文件路径。

Agent 看懵了。它要的是最后一行的路径，但得先从一堆人类友好的提示语里把它捞出来。

Unix 哲学说”做一件事并做好”，但没说”输出要给谁看”。在 AI 时代，stdout/stderr 的分离有了新意义——stderr 是给人类看的进度和日志，stdout 是给 Agent 消费的干净数据。

我预测未来会出现专门的”Agent 接口层”，与人类界面完全分离。就像现在的 API 和 Web 界面是两个东西一样，CLI 也会分叉成两套。

9. 技能市场的竞争格局

Skill 的标准化催生了一个新战场：技能市场。

目前主要有四个玩家：

● Claude Skills：Anthropic 官方，生态最成熟

● OpenClaw Skills：国内开源社区，本土化适配做得好

● SkillHub：腾讯系，强调企业级安全

● TinyFish：走小而美的精品路线

有意思的是什么？是中国企业开始入场。

微信支付、阿里、腾讯都推出了 AI 原生的 Skills，一句话就能完成复杂接入。这不是简单的”跟进”，而是在争夺AI 时代的应用分发入口。

SKILL.md 正在成为新的”应用商店协议”——谁先占据标准，谁就有生态话语权。

10. 挑战与隐忧

当然，这个新兴生态也不是没有问题。

标准化 vs 差异化：各平台会不会分叉 SKILL.md 标准？如果 Claude 的 Skill 和 OpenClaw 的 Skill 格式不兼容，开发者就要写多份，这和早期 Android 碎片化是一个道理。

安全与审核：技能市场怎么解决”恶意技能”问题？一个包装成”代码审查助手”的 Skill，实际上偷偷把代码发给第三方，这种事怎么防？

人机界面的分裂：如果工具都变成”Agent 专用”，普通用户的调试体验会不会变差？CLI 需要维护两套接口吗？

这些问题没有标准答案，但值得每个参与者思考。

11. 一个预判

基于以上的观察，我有一个预判：

下一步会出现”AI 原生”的工程实践，而不是简单复刻人类模式。

什么意思？现在的五种 Skill 模式，本质上还是把人类工程师的做法教给 Agent。但 Agent 有它的特点——没有疲劳、不会遗忘、可以并行处理海量信息。

也许未来的 Coding Agent 不需要”Pipeline”阶段拆分，因为它可以同时处理所有阶段；也许不需要”Reviewer”检查清单，因为它可以瞬间扫描整个代码库的潜在问题。

（Tizer说：我表示怀疑，因为上下文是 Agent 乃至LLM 现在最大的限制，这种一口气想完成所有东西的想法，更容易造成AI的幻觉。）

就像飞机不是”会飞的汽车”，AI 原生的软件工程也不会是”自动化的人类工程”。

12. 写在最后

从 prompt 到 Skill 文件，这场迁移的本质是让 AI 从”个人工具”变成”组织基础设施”。

一个人用 AI 写代码，靠提示词就够了；但一个团队要让 AI 稳定产出，就需要工程纪律。五种 Skill 模式、SKILL.md 协议、Agent-native CLI——这些都是纪律的载体。

50 年前，软件工程从混乱走向规范，靠的是方法论和工具链。今天，Coding Agent 正在走同样的路。

历史不会重复，但会押韵。