AI 转型卡在＂最后一公里＂?谷歌大佬开源的这套工程实践agent,把写代码做成了正规军

最近有个段子在程序员圈里很火：用 AI 写代码时，我觉得自己是全栈神仙；跑起来满屏报错时，我觉得自己是精神病。

2026年，各大企业都在轰轰烈烈的搞AI转型，但真正工程实践落地时，很多时候一不小心却从“AI提效”变成了“AI翻车”。

Cursor、Claude Code 人手一个，结果交付的代码测试形同虚设，重构一次能把核心逻辑写没，上线前还得人工返工大半。

这道转型路上的"最后一公里"难题，最近被一位谷歌大佬用一份开源项目给出了参考答案。他把谷歌内部的AI工程实践，转化成了可以直接执行的agent skill。

它到底是什么？

Agent Skills 是一套给AI编程助手用的"工程规范"。它包含22个结构化skill 和 7条斜杠命令，覆盖了软件开发的完整生命周期：从构思、规划、编码、测试、审查到上线。

作为PM，看到这一整套开发流程的agent skill，真的是很激动，它像是一本AI界的《标准开发流程手册》。这本手册来自谷歌内部的工程实践，有了它，AI写代码时不再走捷径，而是像一个受过严格训练的高级工程师那样，一步步按流程来。

项目地址：github.com/addyosmani/agent-skills

项目背景

先说这个项目背后的人。

作者 Addy Osmani 是谷歌的工程总监（Director），目前负责 Gemini 和 Google Cloud 方向。

它的核心理念直接来源于谷歌内部的工程文化，包括《Software Engineering at Google》一书中的实践原则。不是泛泛的提示词，是真正经过大规模工程实战检验的工作流。

项目深度解析

一、7条命令覆盖完整开发流程：从想法到上线

这是最直观的使用方式。安装后你在AI编程助手里多了7条斜杠命令（slash command），对应软件开发的6个阶段：

阶段	命令	做什么
定义	`/spec`	先写需求文档再写代码
规划	`/plan`	把大任务拆成小的、可验证的子任务
构建	`/build`	按"薄切片"方式增量实现
验证	`/test`	测试驱动开发，测试就是证据
审查	`/review`	五维度Code Review
简化	`/code-simplify`	清晰胜过聪明
上线	`/ship`	灰度发布、回滚方案、监控

过去你怎么做：让AI写完功能，自己手动检查测试写了没、安全问题有没有、代码能不能维护。

现在：输入 /build，AI就会按照"实现→测试→验证→提交"的循环来工作，每个环节都有验证门禁。

二、"防偷懒"设计：AI不能再找借口跳过步骤

这是Agent Skills最独特的创新，也是它和普通提示词最大的区别。

每个Skill里都有一张"反合理化"表（Anti-rationalization Table）。什么意思？AI在执行任务时，经常会"合理化"自己跳过某些步骤。比如：

AI常用的借口	Agent Skills的回击
"这个改动很简单，不需要测试"	简单的改动意味着测试也简单。没有借口。
"我一会儿再加文档"	如果现在不写，永远不会写。文档是交付的一部分。
"性能优化以后再做"	量化当前性能。如果不达标，现在就做。
"这只是个原型，不需要安全检查"	原型会变成产品。安全从第一天就要做。

这种设计的精妙之处在于：它不是告诉AI"你应该写测试"（AI会阳奉阴违），而是提前堵住AI可能用来逃避的每一个借口。

三、拆开两个Skill看看：到底写了什么

每个SKILL.md文件的结构包含：Frontmatter元信息、Overview概述、When to Use触发条件、Process分步流程、Rationalizations反借口表、Red Flags警示信号、Verification验证要求。

这种结构化设计让AI能精确理解何时触发、如何执行、怎样才算完成。

我们选两个最核心的拆开看看，你就明白"结构化的工程技能"到底长什么样。

Skill拆解 1：SDD：Spec-Driven Development（先写规范再写代码）

这个Skill对应 /spec 命令。它解决一个普遍问题：你让AI写一个功能，AI立马就开始写代码，但它其实不确定你到底要什么。

Agent Skills怎么做？它强制AI执行一个四阶段门禁流程，每个阶段必须通过人工确认才能进入下一步：

每个阶段之间都需要人工确认才能推进

第一步不是写代码，是"亮出假设"。 AI必须先列出自己在做什么假设，然后等你确认：

我正在做以下假设：
1. 这是一个Web应用（不是原生App）2. 认证用session-based cookies（不是JWT）3. 数据库是PostgreSQL（基于现有Prisma schema）4. 只面向现代浏览器（不需要兼容IE11）
→ 如有错误请现在纠正，否则我将基于这些假设继续。

为什么这一步这么重要？因为隐性假设是所有返工的最大元凶。AI自己默默脑补了技术栈选型，写了500行代码之后你才发现它选错了，这500行全白费。这个Skill逼AI在第一时间把脑子里的假设全摊开，让你5秒钟就能纠偏。

确认假设后，AI还必须输出一份覆盖6个核心领域的规范文档：目标定义、可执行命令、项目结构、代码风格、测试策略、行为边界（哪些事永远要做、哪些要先问、哪些绝不能做）。

遇到模糊需求怎么办？Skill要求AI把模糊需求翻译成可量化的成功标准：

用户说的	AI翻译成
"让dashboard快一点"	LCP < 2.5s（4G网络），首次数据加载 < 500ms，CLS < 0.1
"加个搜索功能"	支持关键词搜索 + 过滤 + 分页，响应时间 < 200ms

这种翻译让AI的工作目标从"感觉差不多就行"变成了"达到这几个具体指标才算完成"。

这个Skill的防偷懒表：

AI的借口	回击
"这个很简单，不需要写Spec"	简单任务不需要长Spec，但仍需要验收标准。两行Spec也行。
"我写完代码再补Spec"	那叫文档，不叫规范。Spec的价值是在写代码之前逼你想清楚。
"写Spec太慢了"	15分钟的Spec能避免15小时的返工。

Skill拆解 2：Planning & Task Breakdown（任务拆解）

这个Skill对应 /plan 命令。它解决另一个普遍问题：AI拿到需求后一口气全写完，结果代码纠缠在一起，改一处到处崩。

核心理念是一句话：把大任务切成小任务，每个小任务都能独立验证。

但Agent Skills教AI的拆法和人的直觉不一样。它要求纵向切片而不是横向切片：

区别在哪？横向切片做到第4步之前，什么都跑不起来，一旦有问题就是系统性崩溃。纵向切片每做完一步，就有一个可以实际运行和测试的功能。

这个Skill还内置了一套任务尺寸标准：（做过项目管理的看到是不是觉得很亲切？）

如果一个任务是L或以上，必须再拆。 AI在S和M级别的任务上表现最好——这是实践经验的结晶。

每个任务还必须带上4个要素：

验收标准（什么叫"做完了"）
验证方式（跑什么命令确认）
依赖关系（必须先做哪个）
涉及文件清单。
每2-3个任务之后还有强制检查点：所有测试通过？构建没报错？核心流程跑得通？

这个Skill的防偷懒表：

AI的借口	回击
"我边做边想就行"	这就是你弄出乱麻和返工的原因。10分钟规划能省几个小时。
"任务很明显，不用写出来"	写出来。显式的任务列表能暴露隐藏的依赖和遗漏的边界情况。
"规划是额外负担"	规划本身就是工作。没有计划的实现只是在打字。
"我脑子里能记住"	上下文窗口是有限的。写下来的计划能跨越session边界存活。

这两个Skill的完整文件可以在项目仓库的 skills/spec-driven-development/ 和 skills/planning-and-task-breakdown/ 目录下找到。每一个都值得从头到尾读一遍——即使你不用AI工具，这也是一份极好的工程实践参考。

四、谷歌工程文化的"平民化"

这22个Skill不是凭空编出来的，它们直接编码了谷歌内部的工程实践：

海勒姆定律（Hyrum's Law）嵌入API设计：任何可观察行为都会被依赖

碧昂丝规则（Beyonce Rule）嵌入测试：如果你喜欢它，就该给它加个测试

切斯特顿栅栏（Chesterton's Fence）嵌入代码简化：删代码前先搞清它为什么在那

主干开发（Trunk-based Development）嵌入Git工作流

左移原则（Shift Left）嵌入CI/CD：越早发现问题，修复成本越低

过去，你想了解谷歌是怎么做工程的，得去读那本700页的《Software Engineering at Google》。现在，这些实践被浓缩成22个可执行的AI技能文件，你的AI助手直接就能按这套标准工作。

对比维度	Agent Skills	The Agency （详见上一期文章）
定位	软件工程流程标准	全岗位AI角色人设库
覆盖范围	22个开发流程技能	144个跨部门角色
侧重点	"怎么做"（工程流程）	"我是谁"（角色人格）
创新亮点	防偷懒表 + 验证门禁	多工具一键适配
来源	谷歌工程实践	社区驱动

最后聊两句

如果你是一个每天都被 AI 半吊子水平折磨的程序员，或者你是渴望AI编程规范的技术团队leader, 亦或是想了解谷歌的工程师是如何做工程实践的，

这个项目都值得你花上一点时间把这些agent skill配置到你的项目里。它代表了AI Agent的软件工程化 - 从"AI能不能写代码"到"AI怎么按照工程标准写代码"。

项目地址：github.com/addyosmani/agent-skills