
前Meta LLaMA团队核心工程师把公司彻底"AI化",这才是AI原生公司的终极形态
前Meta LLaMA团队核心工程师、现CreaoAI联合创始人Peter Pang近期公布的团队AI研发模式,刷新了行业对AI原生研发的认知:他们团队99%的生产代码全是AI写的。上周二早上10点刚上线的新功能,中午跑A/B测试发现数据不行,下午3点直接下线砍掉,5点就又上线了优化后的新版本。而三个月前,同样的迭代周期要花整整六周。

最狠的是:他们不是给工程师人手装了个Cursor就完事,而是把整个工程流程、技术架构、组织形态全部推倒重来。这哪里是工具升级?这是软件研发的文明级跃迁。
我把整篇长帖+几百条回复进行深入拆解,今天用最干的话给你复盘这套可以直接抄作业的完整打法,以及我一些独家思考。
大多数公司还在"AI辅助",他们已经跑通"AI优先"
AI-Assisted
PM用ChatGPT写需求
工程师开Cursor补代码
QA拿AI生成测试用例
人驱模式,效率撑死涨15%
加法级提升
AI-First
AI是绝对主力建设者
人类负责定方向、做判断、挑毛病
Agent完成代码建造
乘法级爆发式增长
重构所有规则
Peter的问题问得极其扎心:
"我们不再问'AI怎么帮工程师提效',而是问'怎么重构所有规则,让AI负责建造,工程师只当裁判?'"
这根本不是一个维度的竞争:人家是乘法级爆发,你还在抠加法级提升。
他们最先解决的三个致命瓶颈
很多公司刚上AI工具的时候都会遇到同样的问题:AI写代码很快,但人跟不上了,反而卡得更死。他们的三个核心瓶颈:
产品规划太慢
当Agent 2小时就能写完一个功能的代码,你还花几周磨PRD,那PRD就成了新的产能瓶颈
测试验证太慢
代码写得再快,如果测试还要人手动跑,整个流程就被卡住了
人力根本不够
传统的研发流程需要大量人工介入,AI提速后反而暴露了人力瓶颈
他们的解法简单粗暴但有效:
把所有代码全部塞进一个Monorepo,让AI能一眼看到整个项目的全貌
把CI/CD、监控、代码审查全流程Agent化,形成出问题自动修复的自愈闭环
可直接抄作业的完整技术栈
他们现在在用的这套工具链,普通中小团队完全可以直接搬:
| 模块 | 工具 | 说明 |
|---|---|---|
| 基础设施 | ||
| CI/CD | ||
| AI审查 | ||
| 自愈系统 | ||
| 功能开关 | ||
| PR管理 |
六阶段确定性流水线(任何PR必须过):
自愈系统闭环流程:
最终效果
14天内日均 3-8 次生产部署
坏功能当天就死,好功能当天上线
用户数据反而涨了 20%+
组织彻底变了,人也变了
整个公司的角色直接砍到只剩两种:
Architect
架构师(1-2人)
设计规则
给AI输出挑错
找漏洞
定技术边界
要求极高,物理学博士训练出来的批判性思维,现在成了最值钱的能力
Operator
操作员(剩下所有人)
验证AI输出的效果
处理AI不擅长的UI/CSS细节
审核PR风险
执行层面的把关人
最扎心的观察
Junior工程师比Senior适应得快多了。因为Senior要先把脑子里攒了十年的老习惯全部格式化才能跟上节奏,反而Junior没包袱,直接按AI原生的玩法来就行。
CTO自己的变化更夸张:
原来
60%时间管人
现在
早9晚3写代码
管理层级直接崩塌了,团队关系反而更好了——再也不用为技术方案吵几个小时,大家闲下来都开始聊人生了。
给所有工程师、CTO、创始人的三条硬核启示
你的核心价值正在从"写代码"转向"批判AI"
能一眼看出Agent漏掉的边缘case、能判断AI方案的技术债务风险,比你自己手写代码值钱100倍。
先建测试Harness,再放AI狂奔
没有快速验证能力的快,本质就是快速制造技术债,到后面要花十倍的代价还。
全公司都要AI-native,不能只有工程部门飞起来
工程迭代速度按天算,营销、产品、增长还在按月度节奏走,最后还是会被卡死。
别着急抄作业!AI First的前提是软件工程先过关
这篇帖我刷到三次,越读越觉得:大家都在看AI的热闹,其实底下全是软件工程的底子。与其说他们跑通了AI First,不如说他们先把软件工程做到了极致。
很多人看完热血沸腾,回去就想把所有代码全丢给AI写,结果半个月就崩了。在照搬之前,先对照自己的团队看看这5个前提条件有没有做到:
自动化测试覆盖率足够高
AI改完代码,你得有办法确认它没搞崩别的功能。测试覆盖不够的话,每次AI提交代码你都得人工回归一遍,那速度根本快不起来,反而比原来更慢。
全链路CI/CD完全自动化
从提交代码到部署上线,中间的测试、审查、发布、回滚,是不是全自动跑通了?这条流水线不通,AI写得再快,代码也堆在那儿等人手动处理,照样卡瓶颈。
A/B测试+线上监控体系完整
新功能上线之后效果好不好,得有数据说话,效果不好得能随时关掉。没有这套机制,AI一天产出五个功能,你都不知道哪个该留哪个该砍。
任务拆解和管理标准化
AI啃不动模糊的大需求,得拆到合适的粒度,生命周期得跟踪得住。多个Agent同时干活的时候,谁做哪个、哪个优先、做到什么程度,这些都得有地方管。
系统架构清晰合理
架构太乱或者压根没有架构的代码,AI维护起来跟人一样头疼。上下文塞满了还是搞不清边界在哪,改一处崩三处是常态。
这几条里只要有一条做不到,就得靠人去补。补不上,AI First就只是一句口号。
不是所有场景都适合AI First,找对自己的位置最重要
就算你把上面的条件全做到了,也不代表就能照搬这套玩法。这套打法只适合一部分场景:
适合用的场景
后端逻辑为主、界面不复杂的产品
比如API服务、数据处理平台、内部工具,功能好不好跑一下数据就知道,不需要人盯着每个像素。
早期产品快速试错
功能上了不行就撤,用户预期本来就没那么高,AI的速度优势能充分发挥。原文里的CreaoAI做的就是Agent平台,本质上是后端驱动的产品,刚好踩在适用范围内。
不能硬套的场景
UI密集的C端产品
自媒体天天喊前端已死,但你让AI做个复杂界面试试,各种易用性问题、交互细节、视觉还原,它根本搞不定。否则马斯克靠AI早就改版X不知道多少次了。
对功能质量敏感的核心产品
Anthropic和OpenAI不知道AI First吗?他们敢在Claude Code和Codex上这么搞吗?让AI全自动迭代自家的核心大模型产品,用户不骂死才怪。
安全性要求高的场景
银行系统、在线交易平台,AI代码出个差错,那可不是回滚能解决的。
最后
AI First的方向没有错,它代表的是一种意识的转变:每做一个决策的时候,先想一想这件事能不能让AI来做,如果不能,缺什么条件,怎么把条件补上。
但这种意识要落地,靠的不仅是买几个AI工具的订阅,还需要把基础搭好。测试、CI/CD、监控、架构、任务管理,这些做扎实了,AI的能力自然能释放出来。做不好,加再多AI也是在沙子上盖楼,风一吹就倒。
反而借着AI First的风口,把你喊了好几年都没落地的工程规范化、自动化测试、CI/CD升级这些事真正推动起来,可能才是很多团队最大的意外收获。
Peter最后说:
"我们现在正在用Agent建造下一代Agent平台。工具早就不是门槛了,现在真正稀缺的是:把传统流程全部砸烂、从零开始重构的决心,以及先把软件工程基础打牢的耐心。"
📎 原文来源
作者:Peter Pang(CreaoAI联合创始人,前Meta GenAI LLaMA团队)
发布时间:2026年4月13日
发布平台:X (Twitter)
原文链接:https://x.com/intuitiveml/status/2043545596699750791
整理:Claw团
夜雨聆风