OpenAI 平台工程负责人:模型最差的时候是现在.

OpenAI 内部 95% 的工程师已经在用 AI 写代码了，然后呢？

Sherwin Wu 是 OpenAI API 与开发者平台的工程负责人。

考虑到几乎每家 AI 初创公司都在用 OpenAI 的 API，他对行业现状的观察视角，可能比大多数人都要广阔。

他最近分享了一个让我蛮震撼的数字：

OpenAI 内部，95% 的工程师编码时都在用 Codex，100% 的 PR（拉取请求）每天由 Codex 审查。

基本上，任何要上线的代码，Codex 都会过一遍。

更直白地说——他们绝大部分代码，首先是由 AI 生成的。

这已经不是"AI 辅助编程"了。工程师的角色正在发生根本性的转变。

一、巫师、学徒和失控的扫帚

Sherwin 引用了一本 1980 年的 MIT 经典教材《计算机程序的构造与解释》。

这本书开头有个比喻：软件工程师就像巫师，编程语言就像咒语。

你念对了咒语，程序就按你的意愿运行；念错了，后果自负。

四十多年过去了，这个比喻正在字面意义上成为现实。

现在你真的可以直接对 Codex 或 Cursor 说出你想要什么，然后它就会替你完成。就像念咒语一样。

但 Sherwin 马上提醒——更贴切的画面其实是迪士尼《幻想曲》里的"魔法师的学徒"。

米老鼠找到了巫师的帽子，给扫帚下了命令就去睡觉了，结果醒来一切陷入混乱。最后老巫师回来收拾残局。

他现在看到工程师们同时管理着 10 到 20 个不同的 Codex 线程。

这需要经验和判断力——你得确保模型不偏离轨道，不能完全放手不管。

但杠杆效应是惊人的，一个精通这些工具的高级工程师，现在能完成过去几个人的工作量。

这真的让人感觉像在施展魔法。

二、最大的瓶颈不是 AI，是你脑子里的东西

OpenAI 内部有一个团队在做一个有趣的实验：完全维护一个由 Codex 编写的代码库。不允许回退到手写代码，没有"逃生舱口"。

结果发现，当 AI 代理做不到你想要的事情时，问题通常出在一个地方——上下文。

你给它的信息不够明确，或者没有足够的背景让它知道该怎么做。

Sherwin 说，解决之道在于把你头脑中那些"部落知识"。

那些没写在任何文档里、只存在于团队默契中的隐性知识——想办法融入代码库。

可以通过代码注释、代码结构本身，也可以是 Markdown 文件、技能描述，或者任何附加在代码库里的资源。

说白了，AI 的天花板不是模型的智力，而是模型在采取行动之前看到了什么。

所以你需要通过文档来"转移上下文"，让 AI 把有限的 Token 花在真正重要的地方。

三、模型会把你的脚手架当早餐吃掉

回想 2022 年 ChatGPT 刚出来的时候，模型还比较原始，于是出现了大量的产品"脚手架"。

智能体框架、向量数据库、各种引导模型工作的工具层。

那会儿的共识是：你得给模型搭好架子，它才能干活。

但随着模型进步，这些脚手架正在被一个接一个地"吞噬"。

2023 年大家以为向量数据库是把知识注入模型的唯一方式，忙着把公司文档全部向量化、嵌入、优化检索。

现在呢？更好的做法反而是简化逻辑，信任模型，直接给它一套搜索工具让它自己查。

智能体框架的用处也在快速下降。现在流行的基于文件的技能库和上下文管理，未来可能也不再需要了——模型可能自己就能搞定。

这带来一个让很多 AI 创业者焦虑的问题：你今天构建的东西，明天可能就被模型本身的进步给淘汰了。

Sherwin 的建议是：为模型的未来方向构建，而不是为它的现状构建。

他见过不少成功的初创公司，在模型能力只实现 70% 的时候就开始构建产品。

产品初期勉强可用，但随着模型迭代（从 GPT-3 到 3.5 到 4.0），突然一切融会贯通，体验变得惊艳。

如果你假设模型是静态的，你做的永远只是局部最优解。

四、单人十亿美元公司的二阶和三阶效应

Sam Altman 提过"单人十亿美元初创公司"的概念。

Sherwin 觉得这个想法很酷，但他更关注的是大部分人还没想到的连锁反应。

一阶效应：个人借助 AI 工具获得极大杠杆，一个人能搞定过去一个团队的活。

二阶效应：创业门槛大幅降低，会出现一波巨大的创业潮。

尤其是垂直领域的 AI 应用，深入某个行业开发工具往往效果很好。这类初创公司数量增长十倍也不稀奇。

三阶效应：为了支撑一家"单人十亿美元公司"，可能会有十家小型初创公司开发定制化软件来服务它。

B2B SaaS 可能迎来黄金时代——软件和初创公司普遍繁荣。

这种世界里可能不会出现那么多风投青睐的"百倍回报"公司，但会涌现一大批价值几百万到几千万美元的小公司。

对个人来说，这已经足够让你财务自由了。

Sherwin 自己对"单人十亿美元"持保守态度。他觉得光客户支持这一项就很难一个人搞定——除非你的客单价极高、客户极少。

但他相信的是，会有一大批专门为这些微型公司开发支持工具的其他微型公司出现。

整个创业生态的粒度会变细很多。

五、管理者的新活法：把 50% 的时间花在 10% 的人身上

作为 OpenAI 的工程管理者，Sherwin 分享了一个让我印象深刻的管理哲学：

把超过 50% 的时间花在你最顶尖的 10% 的人身上。

在 AI 时代这一点更为关键。因为精通工具的顶尖人才和不太会用的人之间，生产力差距正在急剧拉大。

你的第一优先级是确保最强的人工作顺畅、心情愉快、感觉被赋能。

他用了《人月神话》里的外科医生比喻：软件工程团队里有一个主刀医生，其他所有人都在支持他。

管理者的角色就是让那个最强的人感觉自己就是那位外科医生——仿佛有一支军队在帮他扫清障碍。

实际上可能只是你一个人在背后做这些事，但效果就是不一样。

更有意思的是他提到的一个前瞻想法：让 AI 帮你预测团队成员接下来会被什么阻塞。

让它查看 Notion、Slack、GitHub 的信息流，做二阶三阶的预测——不是"现在有什么问题"，而是"下个月可能出什么问题"。

外科医生需要手术刀的时候，你已经在手里了。

六、推 AI 进公司的正确姿势

Sherwin 观察了大量公司的 AI 部署，他发现成功的公司通常做到了一件事：自上而下和自下而上同时推进。

自上而下：高管决定"我们要 AI 优先"，采购工具，提供支持。

自下而上：找到公司里最兴奋的那些人。

往往不是软件工程师，而是那些"接近技术"的人，比如运营负责人、支持团队的人，不写代码但热爱折腾工具的"Excel 巫师"。

围绕他们组建一个小型"特种部队"团队，去探索、实践、分享。

反模式就是纯粹的行政命令：高管宣布"人人都要用 AI"，但没人知道怎么用，也没人可以学习。

结果全公司都在应付考核，没人真正投入。

这跟很多公司的数字化转型失败是一个道理——技术本身从来不是瓶颈，人才是。

最后，Sherwin 说了一段话，我觉得对所有在这个时代感到焦虑的人都适用：

"接下来两到三年，将是科技和创业领域很长一段时间以来最令人兴奋的时期。不要视之为理所当然。

我 2014 年进入这个行业，中间有五六年感觉科技界挺无聊的。

过去三年是我职业生涯中最疯狂的阶段，而未来两三年会延续这种势头。"

"你不需要是软件工程师才能参与。去使用这些工具，了解它们能做什么不能做什么。本质上，就是去接触、去了解、去融入。"

模型最差的时候是现在。一切只会变得更好。

五天93000行代码——Claude Code Opus 4.6 vs Codex GPT-5.3实测，一个处理大规模代码重构时更稳定，一个在创意性的任务上更出色。

99%的人优化的方向搞错了——他们在优化"写代码的速度"，但真正需要优化的是"清晰度"。