用了三个月AI写代码,我终于明白了,开头定生死
事情是这样的。
最近这几个月,我几乎是泡在AI编程工具里的。Codex、Claude Code、Cursor,三个轮流用,有时候一个任务同时开三个窗口对着看。这种感觉挺上头的,真的,就像同时有三个程序员在帮你干活,你只需要把需求一说,他们就开始咔咔写代码。
但问题也在这里。
前几天我做一个小项目,PRD写得清清楚楚,丢给AI让它写。
第一轮,嗯还行,逻辑基本对但有个地方缺了。
第二轮,把那处改了,旁边又崩了。
第三轮,越改越离谱,代码开始自己给自己加bug。
第四轮的时候我盯着那坨跟需求完全对不上号的东西,整个人都麻了。
我当时就愣住了。
不是???
我说得很清楚啊?为什么会越改越歪呢?
然后我想起了一件事。我一开始丢需求的时候,几乎没有做任何规划。就是把需求文档贴进去,说了一句「帮我做一下」。AI确实做了,但它理解的「做」跟我心里的「做」,根本不是一回事。
这个感受,我后来发现在宝玉的一条推特里被总结得明明白白。
🌈 用好 Coding Agent,重点是两头,尤其是开头。如果一开始就走偏了,后面怎么改都改不好。
我当时看到这句话,感觉被人从屏幕里伸出一只手,啪地扇了我一下。
说得太对了。我之前所有的痛苦,所有那些「明明我都说了啊怎么就不理解呢」的时刻,根源全在第一步。我让AI在没有真正搞清楚我要什么的情况下,就开始写代码了。
而且我后来仔细想了一下,这好像不只是我一个人犯的错。
你去看GitHub上各种AI编程项目的PR记录,去看X上那些吐槽AI写代码的帖子,十有八九都是同样的问题。给了一个模糊的需求,AI给了一个看似合理但其实方向偏了的方案,然后就开始在错误的方向上越走越远,最后返工的代价比从头写还大。
说真的,这不就跟带新人一样吗?
你给一个新来的程序员分配任务,如果只是说「你去把这个功能做了」,他大概率做出来的东西跟你想象的不一样。但如果你花十分钟把需求掰开揉碎了讲清楚,甚至画个简单的流程图,他就能独立把活干好。
AI编程工具说到底就是一个能力超强但极其容易被带偏的「新同事」。
但你如果去看最近AI编程圈的风向,大家都在卷什么呢?
Claude Code刚刚推出了「动态工作流」功能,可以让Claude在一个会话里并行启动几十到几百个子智能体同时干活。听着牛逼吧?是的。
英伟达也开源了一个叫Polar的框架,能让Codex在SWE-Bench上的跑分从3.8%暴涨到26.4%,涨了将近600%。
Codex终于支持Windows了,以后在Windows电脑上也能直接让AI操控桌面。
Opus 4.8也发了,编码能力又全面升级。
坦率的讲,这些新东西都挺让人兴奋的。作为工具,它们确实在一个月比一个月强。
但有时候吧,我觉得我们是不是忽略了一件事。
工具在变强,但大多数人使用工具的方式,其实没有任何变化。
还是把需求一丢,等结果。结果歪了就重来,再歪再重来,反正AI跑得快。这不叫用AI,这叫跟AI玩轮盘赌。
这也是为什么我看到宝玉那条推文的时候,会觉得被戳中了。
他给了一套具体的方法论,我试了之后发现,确实好用。今天就跟你们聊聊这个。
第一步:三份方案,自己拍板
在你真正开始写代码之前,先把需求整理清楚。不是写在脑子里的清楚,是写在纸上的清楚。然后,把这同一个需求,丢给三个不同的AI编程工具,让它们各自出一版设计方案。
Codex出一版,Claude Code出一版,Cursor的Plan模式也来一版。
关键的地方来了。你要用的是三个工具里最强的那个Plan模式。不是让它们直接写代码,是让它们出方案。用GPT-5.5也好,用Opus 4.7也好,用你能拿到的最强的模型。
三个方案拿到手之后,你做的事情不是让它们投票,是你自己来判断。
哪个方案的思路最对?哪个方案考虑到了你没说出来的边界情况?哪个方案在你看来最简洁、最好维护?
选最优的那个方案作为主方案,但不要扔掉另外两个。另外两个方案里可能有更好的局部设计,可能有更巧妙的架构选择,把这些借鉴过来,揉进主方案里。
第二步:拆成 Phase,步步验证
对于特别复杂的项目,不是一口气出一个大方案。是把它拆成几个Phase,每个Phase有明确的完成标准和验证方法。写完一个Phase,验证通过了,再进入下一个。
这个Phase拆得越细,后面的返工就越少。 真的,这是我花了很多冤枉时间才学到的。
第三步:执行时盯关键节点
每个Phase开始执行的时候,AI按着你的方案去写代码。写完之后你先别急着说OK,人工过一遍。这个「过一遍」不是逐行review,那个太累了,是看整体逻辑对不对,关键节点有没有跑偏。
如果AI自己发现不了问题,你可以给它一个具体的纠偏指令。精确的纠偏比笼统的「这个不对,重新写」有效一百倍。
第四步:CR 一个就够了
用GPT-5.5来做CR。把代码丢进去,让它审核代码质量和设计符合度。跟你的原始方案做对照,看有没有遗漏或者绕路的地方。
这里有一个宝玉特别提到的点,我觉得非常重要。
🌈 不要用多个AI交叉Review。
什么意思呢?就是不要让Codex写的代码给Claude Code去Review,Claude Code返回的修改意见再丢给Cursor去改。这样搞的结果,大概率是代码越改越多,越改越乱。
为什么?因为不同的AI有不同的「审美偏好」。A觉得这里应该这么写,B觉得那里不应该那么写,C又觉得前面的全都不对。
三个医生给一个病人开三张方子。= =
病人不死也得掉层皮。
CR就用一个工具,一个模型,就够了。关键是你要有一个清晰的设计方案作为「标准答案」来对照。没有这个对照,AI的CR就是盲人摸象。
聊到这儿,你可能觉得这套方法论听起来挺费劲的。
说实话,一开始是很费劲。
我自己第一次尝试这么做的时候,光设计方案阶段就花了我小半天。用三个工具分别出方案,对比,融合,拆Phase,每个Phase写清楚验证标准。当时我的内心是,我要是自己写这玩意,可能已经写完一半了。
但后来我慢慢发现一个规律。
🌈 你花在设计上的时间,会在执行阶段十倍地省回来。
尤其是当项目规模超过「一个脚本搞定」的时候,这个规律就更明显。小需求可能看不出差别,三四百行代码的东西,让AI直接写也问题不大。但一旦上到几千行、几万行、跨多个文件的量级,前期规划的时间就变得极其划算。
我后来跟一个做工程的朋友聊这个事儿,他说了一句让我印象很深的话。
他说,这在传统软件工程里早就是常识了。需求分析、系统设计、详细设计、编码、测试,这个流程都跑了五六十年了。只不过以前是人对人,文档很正式。现在换成人对AI,大家就觉得可以省掉中间步骤了。
但步骤可以简化,逻辑不能跳过。
你跳过需求分析,AI就猜你的需求。你跳过方案设计,AI就给你一个它觉得最快但不是最好的实现。你跳过code review,小bug就变成大bug。
AI让我们跳过了很多「看起来费时间」的环节,但不代表这些环节没有价值。
顺着这个思路想下去,我突然觉得,这不仅仅是一个AI编程的问题。
你跟AI的所有协作,是不是都有这个规律?
让AI帮你写个PPT,如果你直接说「帮我做一个关于市场分析的PPT」,得到的一定是个空洞的模板。但如果你先花十分钟把大纲想清楚,每一页的核心信息定下来,甚至把数据的来源和口径列明白,AI做出来的PPT是能直接用的。
让AI帮你写一篇文章,如果你直接说「帮我写一篇关于AI编程的文章」,得到的是一篇套话满天飞的东西。但如果你已经想好了核心观点、每一段的走向、开头和结尾要说什么,AI就是在你搭好的骨架上填血肉。
说到写文章这事儿,我自己太有感触了。每次偷懒不想搭框架,直接让AI生成,出来的东西我都不想再看第二遍。但如果我已经把观点想透了,只是需要AI帮我把话说完,那种感觉就不一样了。AI从「造房子的人」变成了「铺地板的人」,岗位变了,产出也完全不一样。
所以问题不是AI有没有变强,它确实在变强。
问题是我们有没有学会跟它协作。
我记得Simon Willison前阵子写过一篇文章,说Anthropic和OpenAI已经找到了产品市场契合点。这个契合点是什么?不是聊天机器人,是编程智能体。企业用户在用Claude Code和Codex写代码这件事上的投入,已经大到让两家公司的企业套餐定价都从「高额折扣」变成了「按API用量计费」。
你想想看,AI编程已经不是「尝鲜」了,是正经的生产力工具。
但成为一个好工具,跟用得好这个工具,是两回事。
给你一把最好的锤子,不代表你就能造出漂亮的椅子。你还得知道怎么设计那把椅子,知道木头的纹理往哪个方向走,知道什么时候该用力,什么时候该收手。
AI编程工具也是一样的。它可以帮你省掉80%的体力活,但剩下20%的判断,你省不了。
而且坦白说,我是真的觉得,这20%才是真正值钱的地方。
写代码这件事,将来一定会变得越来越不重要。不是不重要,是门槛越来越低,低到任何人都能让AI帮你写。但「设计一个软件应该怎么做」,这件事的门槛反而会越来越高。
因为以前你有一个过滤机制。不会写代码的人,根本进不了这场游戏。现在这个机制没了,任何人都可以说「帮我做一个xxx」,能得到一个看起来能用的东西。但能不能用、好不好用、会不会在某天突然崩掉,区别全在设计阶段你是怎么想的。
宝玉的方法论,说到底就是在教你「怎么想」。用三个工具的Plan模式同时出方案,不是为了省时间,是为了逼你多看几个角度。拆成多个Phase写清楚验收标准,不是为了形式主义,是为了让你自己把需求真正想透。
这才是跟AI协作的正确姿势。
不是你把AI当打工者,往那一丢让它自己琢磨。是你做大脑,AI做手脚。 所有关键的判断你来下,所有重复的执行它来做。
我最近开始养成一个习惯。每次要给AI分配一个任务之前,先在脑子里过一遍这个流程,我要的是什么、为什么是这个方案、成功标准是什么。就这三件事,想清楚,写下来,再丢给AI。花的时间可能就五分钟十分钟,但后面的效率完全不一样。
试着想想看,如果你今天正好有个项目要用AI写,不妨试试宝玉这套方法。先别急着让AI写代码,先让它出方案。出三个方案,你选一个最好的。拆成Phase,定好验收标准。然后你就会发现一个很神奇的事。
AI写的代码变好了。
不是AI变好了,是你变好了。
是你学会了怎么当一个好用的甲方。
关注「科技热点Daily」,不只是看热点,更是学会怎么用好 AI。
夜雨聆风