乐于分享
好东西不私藏

Stripe 每周合并 1300 个 AI PR:他们用"小兵"重新定义了软件开发

Stripe 每周合并 1300 个 AI PR:他们用"小兵"重新定义了软件开发


摘要:Stripe 工程师 Steve Khaliski 揭示了一个惊人数字——每周有 1300 个无需人工编写的 PR 被合并。他们是怎么做到的?答案是”小兵”(Minions):一批运行在云端、可并行启动的 AI 工程师。本文带你拆解 Stripe 的 AI 工程实践,以及 AI 作为经济参与者的下一个时代。


引言:每周 1300 个 AI PR,悄然发生的范式转移

软件开发的方式,正在被悄悄重写。

Stripe 工程师 Steve Khaliski 最近在 How I AI 播客中分享了一个数字:Stripe 每周会合并大约 1300 个 PR,这些 PR 的代码几乎没有人工参与编写,只有最终的 Code Review 由人类完成。

这不是未来,这是他们正在运行的日常。

Steve 说:”我已经不记得上一次从文本编辑器开始写代码是什么时候了。”

这句话值得细品。他不是说”我很少写代码”,而是说工作的起点已经彻底变了——从打开 IDE,变成了在 Slack 里点一个 emoji。

“小兵”是什么?

Minions(小兵)是 Stripe 内部构建的一套 AI 工程代理系统,核心逻辑其实并不复杂:

  1. Stripe 本就有一套成熟的云端开发环境(hosted dev environment),工程师可以随时 SSH 进去,所有代码和服务都已就绪;
  2. 在此基础上,他们把 Goose 作为 agent 框架,注入 Stripe 内部文档、CI 工具、测试数据等;
  3. 工程师通过 Slack 发起任务,小兵自动完成从”理解需求”到”提交 PR”的全流程。

关键在于:这些小兵运行在云端的隔离环境里,不依赖工程师本机,可以大量并行启动

“不只是拥有一个,我可以同时启动很多个,在完全隔离的环境里并行推进不同的修改。” Steve 说。

一个表情符号,启动一个”工程师”

Steve 在直播中演示了完整流程:

他在 Slack 频道里输入了一条消息,大意是”我想改进 docs.stripe.com 上机器间支付的落地页,让它有个好的代码示例”,然后对这条消息点了一个自定义 emoji:create minion pay-server

几秒钟内,系统回复:

  • • 已为 pay-server 仓库创建新分支
  • • 正在启动开发环境
  • • 落地页代码示例已开始生成

随后可以点击”follow along”实时跟踪进度:Goose 开始读取相关文件、搜索代码库、规划修改路径,最终自动提交并生成 PR。

整个过程,Steve 没有打开一次 VS Code。

这背后的核心是”激活能量“(activation energy)的降低。Steve 解释说:”当你在大型组织里,一个好想法到真正落地之间,有太多摩擦——功能权限、技术壁垒、沟通协调。AI 让这一切趋近于零。”

Slack 对于 Minions 而言是天然的入口,因为”整个公司都在 Slack 里”。不只是工程师——产品经理、设计师,只要能用文字描述清楚需求,都能触发一个 Minion。

开发者体验 = AI 体验

Steve 特别强调了一件事:好的 DX(开发者体验)会直接提升 agent 的成功率。

想象你是第一天入职的新工程师,面对一个庞大的代码库,没有文档、没有工具、没有引导——很快就会迷失。Agent 也一样。

“如果 90% 的常见操作都有清晰的文档和工具链支撑,agent 一次命中的概率就会大大提高。”

Stripe 多年来积累的工程基础设施——完善的内部文档、成熟的 CI 流水线、标准化的 API 变更流程——不仅服务于人类工程师,同样成了 Minions 的”导轨”。

这带来了一个有趣的正向循环:

  • • 为人类工程师投资 DX → agent 成功率更高
  • • agent 成功率更高 → 更多工程师愿意采用 → 更多反馈推动 DX 改进

另一个常被忽视的关键:云端环境与并行工作树

“不管你的 MacBook 多强,开三四个 worktree 之后,风扇声就像飞机起飞。” Steve 笑道。本地机器的物理限制,是规模化 AI 工程的天花板。而云端环境打破了这个限制——agent 可以在隔离的云端跑,本机负责 review 和协调就够了。

他建议 CTO 和工程 VP:”如果你们想在接下来一年里真正释放 AI 的潜力,把云端开发环境这件事搞定,是最值得的投资。”

AI 作为经济参与者:机器间支付

如果说 Minions 展示的是 AI 在内部研发中的效率飞跃,那么 Steve 接下来演示的第二个 Demo,则指向了一个更深远的变化:AI 作为经济参与者

他设计了一个场景:让 Claude Code 帮同事 Jen 策划生日派对。

提示词很简单:研究 Jen 的喜好,找到合适的派对场地,寄出邀请函,最后用 Stripe Climate 抵消消耗的碳排放。

整个过程中,agent 调用了四个真实的第三方服务,并实际支付了费用

  • • Browser Base:创建浏览器会话,抓取 Jen 的个人网站,发现她是一个”痴迷抹茶的烘焙爱好者”。费用:几分钱。
  • • Parallel AI:搜索纽约适合办派对的抹茶主题场地。
  • • Postal Form:生成 PDF 邀请函并实际寄出实体信件。
  • • Stripe Climate:用 $1.65 抵消了 4.4 公斤 的碳排放(本次任务共消耗约 70k tokens)。

整场派对花费约 $5-6,碳中和,并且 Steve 将真的收到一封邮寄来的邀请函。

这背后是 Stripe 正在推进的一个新协议:Machine Payment Protocol(机器间支付协议),与 Tempo 联合设计。核心理念是:agent 不需要提前注册账号、绑定信用卡、选择订阅计划——它只需要为当前任务所需的服务按需微支付

Steve 说:”我们需要给 agent 配备花钱的能力,让它不仅能消耗 tokens,还能在执行任务过程中为第三方服务付费。”

这个演示里有个细节很有意思:Steve 在征求合作伙伴产品反馈时,收到的回复不是人写的,而是对方工程师”懒得自己写,让 Claude/CodeEx 读了 Stripe 文档后代劳的”。这种事在同一周发生了四五次。

“这让我突然意识到,谁是新的用户。”

结语:从”写代码”到”管代码”

代码审查的压力增加了吗?当然。1300 个 PR/周,总得有人看。

Steve 的答案是:以前花在写代码上的时间,现在用来 review。重心转移了,但总量不一定增加。

更重要的是,当”写代码”变得越来越容易,瓶颈会移动到其他地方——想法的质量、review 的深度、分发的能力。AI 不会让工程师失业,但会让工程师的工作重心彻底改变。

Steve 在节目最后说了一句话,让人印象深刻:

“我在养孩子的同时,正在给我的 agent 写 soul.md 文件。我不知道这两件事谁在影响谁,但它们确实在同时发生。”

这大概是对这个时代最真实的注脚:我们既是父母,也是造物者;既在学习如何引导孩子,也在摸索如何教会机器。

软件开发的下一个时代,已经在 Stripe 的 Slack 频道里,悄悄开始了。