最近有个段子在程序员圈里很火:用 AI 写代码时,我觉得自己是全栈神仙;跑起来满屏报错时,我觉得自己是精神病。
2026年,各大企业都在轰轰烈烈的搞AI转型,但真正工程实践落地时,很多时候一不小心却从“AI提效”变成了“AI翻车”。
Cursor、Claude Code 人手一个,结果交付的代码测试形同虚设,重构一次能把核心逻辑写没,上线前还得人工返工大半。
这道转型路上的"最后一公里"难题,最近被一位谷歌大佬用一份开源项目给出了参考答案。他把谷歌内部的AI工程实践,转化成了可以直接执行的agent skill。
它到底是什么?
Agent Skills 是一套给AI编程助手用的"工程规范"。它包含22个结构化skill 和 7条斜杠命令,覆盖了软件开发的完整生命周期:从构思、规划、编码、测试、审查到上线。
作为PM,看到这一整套开发流程的agent skill,真的是很激动,它像是一本AI界的《标准开发流程手册》。这本手册来自谷歌内部的工程实践,有了它,AI写代码时不再走捷径,而是像一个受过严格训练的高级工程师那样,一步步按流程来。
项目地址:github.com/addyosmani/agent-skills
项目背景
先说这个项目背后的人。
作者 Addy Osmani 是谷歌的工程总监(Director),目前负责 Gemini 和 Google Cloud 方向。
它的核心理念直接来源于谷歌内部的工程文化,包括《Software Engineering at Google》一书中的实践原则。不是泛泛的提示词,是真正经过大规模工程实战检验的工作流。
项目深度解析
一、7条命令覆盖完整开发流程:从想法到上线
这是最直观的使用方式。安装后你在AI编程助手里多了7条斜杠命令(slash command),对应软件开发的6个阶段:

/spec | ||
/plan | ||
/build | ||
/test | ||
/review | ||
/code-simplify | ||
/ship |
过去你怎么做:让AI写完功能,自己手动检查测试写了没、安全问题有没有、代码能不能维护。
现在:输入 /build,AI就会按照"实现→测试→验证→提交"的循环来工作,每个环节都有验证门禁。
二、"防偷懒"设计:AI不能再找借口跳过步骤
这是Agent Skills最独特的创新,也是它和普通提示词最大的区别。
每个Skill里都有一张"反合理化"表(Anti-rationalization Table)。什么意思?AI在执行任务时,经常会"合理化"自己跳过某些步骤。比如:
这种设计的精妙之处在于:它不是告诉AI"你应该写测试"(AI会阳奉阴违),而是提前堵住AI可能用来逃避的每一个借口。
三、拆开两个Skill看看:到底写了什么
每个SKILL.md文件的结构包含:Frontmatter元信息、Overview概述、When to Use触发条件、Process分步流程、Rationalizations反借口表、Red Flags警示信号、Verification验证要求。
这种结构化设计让AI能精确理解何时触发、如何执行、怎样才算完成。
我们选两个最核心的拆开看看,你就明白"结构化的工程技能"到底长什么样。
Skill拆解 1:SDD:Spec-Driven Development(先写规范再写代码)
这个Skill对应 /spec 命令。它解决一个普遍问题:你让AI写一个功能,AI立马就开始写代码,但它其实不确定你到底要什么。
Agent Skills怎么做?它强制AI执行一个四阶段门禁流程,每个阶段必须通过人工确认才能进入下一步:

每个阶段之间都需要人工确认才能推进
第一步不是写代码,是"亮出假设"。 AI必须先列出自己在做什么假设,然后等你确认:
我正在做以下假设:
1. 这是一个Web应用(不是原生App)2. 认证用session-based cookies(不是JWT)3. 数据库是PostgreSQL(基于现有Prisma schema)4. 只面向现代浏览器(不需要兼容IE11)
→ 如有错误请现在纠正,否则我将基于这些假设继续。
为什么这一步这么重要?因为隐性假设是所有返工的最大元凶。AI自己默默脑补了技术栈选型,写了500行代码之后你才发现它选错了,这500行全白费。这个Skill逼AI在第一时间把脑子里的假设全摊开,让你5秒钟就能纠偏。
确认假设后,AI还必须输出一份覆盖6个核心领域的规范文档:目标定义、可执行命令、项目结构、代码风格、测试策略、行为边界(哪些事永远要做、哪些要先问、哪些绝不能做)。
遇到模糊需求怎么办?Skill要求AI把模糊需求翻译成可量化的成功标准:
这种翻译让AI的工作目标从"感觉差不多就行"变成了"达到这几个具体指标才算完成"。
这个Skill的防偷懒表:
Skill拆解 2:Planning & Task Breakdown(任务拆解)
这个Skill对应 /plan 命令。它解决另一个普遍问题:AI拿到需求后一口气全写完,结果代码纠缠在一起,改一处到处崩。
核心理念是一句话:把大任务切成小任务,每个小任务都能独立验证。
但Agent Skills教AI的拆法和人的直觉不一样。它要求纵向切片而不是横向切片:

区别在哪?横向切片做到第4步之前,什么都跑不起来,一旦有问题就是系统性崩溃。纵向切片每做完一步,就有一个可以实际运行和测试的功能。
这个Skill还内置了一套任务尺寸标准:(做过项目管理的看到是不是觉得很亲切?)

如果一个任务是L或以上,必须再拆。 AI在S和M级别的任务上表现最好——这是实践经验的结晶。
每个任务还必须带上4个要素:
验收标准(什么叫"做完了")
验证方式(跑什么命令确认)
依赖关系(必须先做哪个)
涉及文件清单。
每2-3个任务之后还有强制检查点:所有测试通过?构建没报错?核心流程跑得通?
这个Skill的防偷懒表:
这两个Skill的完整文件可以在项目仓库的
skills/spec-driven-development/和skills/planning-and-task-breakdown/目录下找到。每一个都值得从头到尾读一遍——即使你不用AI工具,这也是一份极好的工程实践参考。
四、谷歌工程文化的"平民化"
这22个Skill不是凭空编出来的,它们直接编码了谷歌内部的工程实践:
海勒姆定律(Hyrum's Law)嵌入API设计:任何可观察行为都会被依赖
碧昂丝规则(Beyonce Rule)嵌入测试:如果你喜欢它,就该给它加个测试
切斯特顿栅栏(Chesterton's Fence)嵌入代码简化:删代码前先搞清它为什么在那
主干开发(Trunk-based Development)嵌入Git工作流
左移原则(Shift Left)嵌入CI/CD:越早发现问题,修复成本越低
过去,你想了解谷歌是怎么做工程的,得去读那本700页的《Software Engineering at Google》。现在,这些实践被浓缩成22个可执行的AI技能文件,你的AI助手直接就能按这套标准工作。
同类对比
选择建议:
关注代码质量和工程规范 → 选 Agent Skills
需要各种职能角色的AI人设 → 选 The Agency
两者不冲突,可以叠加使用。Agent Skills管流程,The Agency管角色定位。
最后聊两句
如果你是一个每天都被 AI 半吊子水平折磨的程序员,或者你是渴望AI编程规范的技术团队leader, 亦或是想了解谷歌的工程师是如何做工程实践的,
这个项目都值得你花上一点时间把这些agent skill配置到你的项目里。它代表了AI Agent的软件工程化 - 从"AI能不能写代码"到"AI怎么按照工程标准写代码"。
项目地址:github.com/addyosmani/agent-skills
夜雨聆风