OpenAI 内部 95% 的工程师已经在用 AI 写代码了,然后呢?
Sherwin Wu 是 OpenAI API 与开发者平台的工程负责人。
考虑到几乎每家 AI 初创公司都在用 OpenAI 的 API,他对行业现状的观察视角,可能比大多数人都要广阔。

他最近分享了一个让我蛮震撼的数字:
OpenAI 内部,95% 的工程师编码时都在用 Codex,100% 的 PR(拉取请求)每天由 Codex 审查。
基本上,任何要上线的代码,Codex 都会过一遍。
更直白地说——他们绝大部分代码,首先是由 AI 生成的。
这已经不是"AI 辅助编程"了。工程师的角色正在发生根本性的转变。
一、巫师、学徒和失控的扫帚
Sherwin 引用了一本 1980 年的 MIT 经典教材《计算机程序的构造与解释》。
这本书开头有个比喻:软件工程师就像巫师,编程语言就像咒语。
你念对了咒语,程序就按你的意愿运行;念错了,后果自负。
四十多年过去了,这个比喻正在字面意义上成为现实。
现在你真的可以直接对 Codex 或 Cursor 说出你想要什么,然后它就会替你完成。就像念咒语一样。
但 Sherwin 马上提醒——更贴切的画面其实是迪士尼《幻想曲》里的"魔法师的学徒"。

米老鼠找到了巫师的帽子,给扫帚下了命令就去睡觉了,结果醒来一切陷入混乱。最后老巫师回来收拾残局。
他现在看到工程师们同时管理着 10 到 20 个不同的 Codex 线程。
这需要经验和判断力——你得确保模型不偏离轨道,不能完全放手不管。
但杠杆效应是惊人的,一个精通这些工具的高级工程师,现在能完成过去几个人的工作量。
这真的让人感觉像在施展魔法。
二、最大的瓶颈不是 AI,是你脑子里的东西
OpenAI 内部有一个团队在做一个有趣的实验:完全维护一个由 Codex 编写的代码库。不允许回退到手写代码,没有"逃生舱口"。
结果发现,当 AI 代理做不到你想要的事情时,问题通常出在一个地方——上下文。
你给它的信息不够明确,或者没有足够的背景让它知道该怎么做。
Sherwin 说,解决之道在于把你头脑中那些"部落知识"。
那些没写在任何文档里、只存在于团队默契中的隐性知识——想办法融入代码库。
可以通过代码注释、代码结构本身,也可以是 Markdown 文件、技能描述,或者任何附加在代码库里的资源。
说白了,AI 的天花板不是模型的智力,而是模型在采取行动之前看到了什么。
所以你需要通过文档来"转移上下文",让 AI 把有限的 Token 花在真正重要的地方。
三、模型会把你的脚手架当早餐吃掉
回想 2022 年 ChatGPT 刚出来的时候,模型还比较原始,于是出现了大量的产品"脚手架"。
智能体框架、向量数据库、各种引导模型工作的工具层。
那会儿的共识是:你得给模型搭好架子,它才能干活。
但随着模型进步,这些脚手架正在被一个接一个地"吞噬"。
2023 年大家以为向量数据库是把知识注入模型的唯一方式,忙着把公司文档全部向量化、嵌入、优化检索。
现在呢?更好的做法反而是简化逻辑,信任模型,直接给它一套搜索工具让它自己查。
智能体框架的用处也在快速下降。现在流行的基于文件的技能库和上下文管理,未来可能也不再需要了——模型可能自己就能搞定。
这带来一个让很多 AI 创业者焦虑的问题:你今天构建的东西,明天可能就被模型本身的进步给淘汰了。
Sherwin 的建议是:为模型的未来方向构建,而不是为它的现状构建。
他见过不少成功的初创公司,在模型能力只实现 70% 的时候就开始构建产品。
产品初期勉强可用,但随着模型迭代(从 GPT-3 到 3.5 到 4.0),突然一切融会贯通,体验变得惊艳。

如果你假设模型是静态的,你做的永远只是局部最优解。
四、单人十亿美元公司的二阶和三阶效应
Sam Altman 提过"单人十亿美元初创公司"的概念。
Sherwin 觉得这个想法很酷,但他更关注的是大部分人还没想到的连锁反应。
一阶效应:个人借助 AI 工具获得极大杠杆,一个人能搞定过去一个团队的活。
二阶效应:创业门槛大幅降低,会出现一波巨大的创业潮。
尤其是垂直领域的 AI 应用,深入某个行业开发工具往往效果很好。这类初创公司数量增长十倍也不稀奇。
三阶效应:为了支撑一家"单人十亿美元公司",可能会有十家小型初创公司开发定制化软件来服务它。
B2B SaaS 可能迎来黄金时代——软件和初创公司普遍繁荣。
这种世界里可能不会出现那么多风投青睐的"百倍回报"公司,但会涌现一大批价值几百万到几千万美元的小公司。
对个人来说,这已经足够让你财务自由了。
Sherwin 自己对"单人十亿美元"持保守态度。他觉得光客户支持这一项就很难一个人搞定——除非你的客单价极高、客户极少。
但他相信的是,会有一大批专门为这些微型公司开发支持工具的其他微型公司出现。
整个创业生态的粒度会变细很多。
五、管理者的新活法:把 50% 的时间花在 10% 的人身上
作为 OpenAI 的工程管理者,Sherwin 分享了一个让我印象深刻的管理哲学:
把超过 50% 的时间花在你最顶尖的 10% 的人身上。
在 AI 时代这一点更为关键。因为精通工具的顶尖人才和不太会用的人之间,生产力差距正在急剧拉大。
你的第一优先级是确保最强的人工作顺畅、心情愉快、感觉被赋能。
他用了《人月神话》里的外科医生比喻:软件工程团队里有一个主刀医生,其他所有人都在支持他。
管理者的角色就是让那个最强的人感觉自己就是那位外科医生——仿佛有一支军队在帮他扫清障碍。
实际上可能只是你一个人在背后做这些事,但效果就是不一样。
更有意思的是他提到的一个前瞻想法:让 AI 帮你预测团队成员接下来会被什么阻塞。
让它查看 Notion、Slack、GitHub 的信息流,做二阶三阶的预测——不是"现在有什么问题",而是"下个月可能出什么问题"。
外科医生需要手术刀的时候,你已经在手里了。
六、推 AI 进公司的正确姿势
Sherwin 观察了大量公司的 AI 部署,他发现成功的公司通常做到了一件事:自上而下和自下而上同时推进。
自上而下:高管决定"我们要 AI 优先",采购工具,提供支持。
自下而上:找到公司里最兴奋的那些人。
往往不是软件工程师,而是那些"接近技术"的人,比如运营负责人、支持团队的人,不写代码但热爱折腾工具的"Excel 巫师"。
围绕他们组建一个小型"特种部队"团队,去探索、实践、分享。
反模式就是纯粹的行政命令:高管宣布"人人都要用 AI",但没人知道怎么用,也没人可以学习。
结果全公司都在应付考核,没人真正投入。
这跟很多公司的数字化转型失败是一个道理——技术本身从来不是瓶颈,人才是。

最后,Sherwin 说了一段话,我觉得对所有在这个时代感到焦虑的人都适用:
"接下来两到三年,将是科技和创业领域很长一段时间以来最令人兴奋的时期。不要视之为理所当然。
我 2014 年进入这个行业,中间有五六年感觉科技界挺无聊的。
过去三年是我职业生涯中最疯狂的阶段,而未来两三年会延续这种势头。"
"你不需要是软件工程师才能参与。去使用这些工具,了解它们能做什么不能做什么。本质上,就是去接触、去了解、去融入。"
模型最差的时候是现在。一切只会变得更好。
更多精彩文章:
全球顶尖数学家陶哲轩最新观点:那些我们沿袭了几百年的做事方式,可能很快就不再适用;但AI缺乏基于阶段性进展进行累积式构建的能力。
五天93000行代码——Claude Code Opus 4.6 vs Codex GPT-5.3实测,一个处理大规模代码重构时更稳定,一个在创意性的任务上更出色。
夜雨聆风