99%代码AI写完,一天部署8次!前Meta工程师把公司彻底＂AI化＂

团爸

Claw团｜AI架构师

阅读约 8 分钟

前Meta LLaMA团队核心工程师把公司彻底"AI化"，这才是AI原生公司的终极形态

核心关键词

AI First研发效能AI原生工程实践持续部署

前Meta LLaMA团队核心工程师、现CreaoAI联合创始人Peter Pang近期公布的团队AI研发模式，刷新了行业对AI原生研发的认知：他们团队99%的生产代码全是AI写的。上周二早上10点刚上线的新功能，中午跑A/B测试发现数据不行，下午3点直接下线砍掉，5点就又上线了优化后的新版本。而三个月前，同样的迭代周期要花整整六周。

最狠的是：他们不是给工程师人手装了个Cursor就完事，而是把整个工程流程、技术架构、组织形态全部推倒重来。这哪里是工具升级？这是软件研发的文明级跃迁。

我把整篇长帖+几百条回复进行深入拆解，今天用最干的话给你复盘这套可以直接抄作业的完整打法，以及我一些独家思考。

大多数公司还在"AI辅助"，他们已经跑通"AI优先"

AI-Assisted

PM用ChatGPT写需求

工程师开Cursor补代码

QA拿AI生成测试用例

人驱模式，效率撑死涨15%

加法级提升

AI-First

AI是绝对主力建设者

人类负责定方向、做判断、挑毛病

Agent完成代码建造

乘法级爆发式增长

重构所有规则

Peter的问题问得极其扎心：

"我们不再问'AI怎么帮工程师提效'，而是问'怎么重构所有规则，让AI负责建造，工程师只当裁判？'"

这根本不是一个维度的竞争：人家是乘法级爆发，你还在抠加法级提升。

他们最先解决的三个致命瓶颈

很多公司刚上AI工具的时候都会遇到同样的问题：AI写代码很快，但人跟不上了，反而卡得更死。他们的三个核心瓶颈：

产品规划太慢

当Agent 2小时就能写完一个功能的代码，你还花几周磨PRD，那PRD就成了新的产能瓶颈

测试验证太慢

代码写得再快，如果测试还要人手动跑，整个流程就被卡住了

人力根本不够

传统的研发流程需要大量人工介入，AI提速后反而暴露了人力瓶颈

他们的解法简单粗暴但有效：

把所有代码全部塞进一个Monorepo，让AI能一眼看到整个项目的全貌
把CI/CD、监控、代码审查全流程Agent化，形成出问题自动修复的自愈闭环

可直接抄作业的完整技术栈

他们现在在用的这套工具链，普通中小团队完全可以直接搬：

模块	工具	说明
基础设施	AWS + CloudWatch	所有日志全结构化，AI可以直接查询分析
CI/CD	GitHub Actions	六阶段确定性流水线，全程不用人干预
AI审查	Claude Opus 4.6	三重并行审查：代码质量 + 安全漏洞 + 依赖风险
自愈系统	自动化流程	健康报告 → 错误聚类 → Linear建单 → Agent修复
功能开关	Statsig	灰度发布 + 一键秒杀开关，影响面控制最小
PR管理	Graphite	堆叠PR + 自动Rebase，完全不用人处理合并冲突

六阶段确定性流水线（任何PR必须过）：

类型检查→Lint→单元测试→集成测试→E2E测试→合并

自愈系统闭环流程：

每日健康报告→错误自动聚类→Linear建工单→Agent修复→自动验证关闭

最终效果

14天内日均 3-8 次生产部署

坏功能当天就死，好功能当天上线

用户数据反而涨了 20%+

组织彻底变了，人也变了

整个公司的角色直接砍到只剩两种：

Architect

架构师（1-2人）

设计规则
给AI输出挑错
找漏洞
定技术边界

要求极高，物理学博士训练出来的批判性思维，现在成了最值钱的能力

Operator

操作员（剩下所有人）

验证AI输出的效果
处理AI不擅长的UI/CSS细节
审核PR风险

执行层面的把关人

最扎心的观察

Junior工程师比Senior适应得快多了。因为Senior要先把脑子里攒了十年的老习惯全部格式化才能跟上节奏，反而Junior没包袱，直接按AI原生的玩法来就行。

CTO自己的变化更夸张：

原来

60%时间管人

→

现在

早9晚3写代码

管理层级直接崩塌了，团队关系反而更好了——再也不用为技术方案吵几个小时，大家闲下来都开始聊人生了。

给所有工程师、CTO、创始人的三条硬核启示

你的核心价值正在从"写代码"转向"批判AI"

能一眼看出Agent漏掉的边缘case、能判断AI方案的技术债务风险，比你自己手写代码值钱100倍。

先建测试Harness，再放AI狂奔

没有快速验证能力的快，本质就是快速制造技术债，到后面要花十倍的代价还。

全公司都要AI-native，不能只有工程部门飞起来

工程迭代速度按天算，营销、产品、增长还在按月度节奏走，最后还是会被卡死。

别着急抄作业！AI First的前提是软件工程先过关

这篇帖我刷到三次，越读越觉得：大家都在看AI的热闹，其实底下全是软件工程的底子。与其说他们跑通了AI First，不如说他们先把软件工程做到了极致。

很多人看完热血沸腾，回去就想把所有代码全丢给AI写，结果半个月就崩了。在照搬之前，先对照自己的团队看看这5个前提条件有没有做到：

自动化测试覆盖率足够高

AI改完代码，你得有办法确认它没搞崩别的功能。测试覆盖不够的话，每次AI提交代码你都得人工回归一遍，那速度根本快不起来，反而比原来更慢。

全链路CI/CD完全自动化

从提交代码到部署上线，中间的测试、审查、发布、回滚，是不是全自动跑通了？这条流水线不通，AI写得再快，代码也堆在那儿等人手动处理，照样卡瓶颈。

A/B测试+线上监控体系完整

新功能上线之后效果好不好，得有数据说话，效果不好得能随时关掉。没有这套机制，AI一天产出五个功能，你都不知道哪个该留哪个该砍。

任务拆解和管理标准化

AI啃不动模糊的大需求，得拆到合适的粒度，生命周期得跟踪得住。多个Agent同时干活的时候，谁做哪个、哪个优先、做到什么程度，这些都得有地方管。

系统架构清晰合理

架构太乱或者压根没有架构的代码，AI维护起来跟人一样头疼。上下文塞满了还是搞不清边界在哪，改一处崩三处是常态。

这几条里只要有一条做不到，就得靠人去补。补不上，AI First就只是一句口号。

不是所有场景都适合AI First，找对自己的位置最重要

就算你把上面的条件全做到了，也不代表就能照搬这套玩法。这套打法只适合一部分场景：

适合用的场景

后端逻辑为主、界面不复杂的产品

比如API服务、数据处理平台、内部工具，功能好不好跑一下数据就知道，不需要人盯着每个像素。

早期产品快速试错

功能上了不行就撤，用户预期本来就没那么高，AI的速度优势能充分发挥。原文里的CreaoAI做的就是Agent平台，本质上是后端驱动的产品，刚好踩在适用范围内。

不能硬套的场景

UI密集的C端产品

自媒体天天喊前端已死，但你让AI做个复杂界面试试，各种易用性问题、交互细节、视觉还原，它根本搞不定。否则马斯克靠AI早就改版X不知道多少次了。

对功能质量敏感的核心产品

Anthropic和OpenAI不知道AI First吗？他们敢在Claude Code和Codex上这么搞吗？让AI全自动迭代自家的核心大模型产品，用户不骂死才怪。

安全性要求高的场景

银行系统、在线交易平台，AI代码出个差错，那可不是回滚能解决的。

最后

AI First的方向没有错，它代表的是一种意识的转变：每做一个决策的时候，先想一想这件事能不能让AI来做，如果不能，缺什么条件，怎么把条件补上。

但这种意识要落地，靠的不仅是买几个AI工具的订阅，还需要把基础搭好。测试、CI/CD、监控、架构、任务管理，这些做扎实了，AI的能力自然能释放出来。做不好，加再多AI也是在沙子上盖楼，风一吹就倒。

反而借着AI First的风口，把你喊了好几年都没落地的工程规范化、自动化测试、CI/CD升级这些事真正推动起来，可能才是很多团队最大的意外收获。

Peter最后说：

"我们现在正在用Agent建造下一代Agent平台。工具早就不是门槛了，现在真正稀缺的是：把传统流程全部砸烂、从零开始重构的决心，以及先把软件工程基础打牢的耐心。"

📎 原文来源

作者：Peter Pang（CreaoAI联合创始人，前Meta GenAI LLaMA团队）

发布时间：2026年4月13日

发布平台：X (Twitter)

原文链接：https://x.com/intuitiveml/status/2043545596699750791

整理：Claw团