
我第一眼看到这个标题,脑子里其实咯噔了一下。不是那种科幻电影里的害怕,更像是早上刚醒,突然看到一件离自己很近的事。以前我们说 AI 进步,默认还是人在推着它往前走。人写代码,人设计实验,人训练模型,人做判断。AI 只是旁边那个越来越能干的助手。
AI 开始参与构建 AI 自己。
看完以后,我脑子里反复冒出来的不是「AI 会不会失控」,而是一个更贴近普通人的问题。如果 AI 连 AI 自己都开始帮忙开发了,那我们接下来还该学什么?
我现在更想补的是怎么管住 AI 交出来的东西。
最扎眼的,不是 AI 会写代码
Anthropic 在文章里提到一个很夸张的变化。到 2026 年 5 月,Anthropic 合并进代码库的代码里,超过 80% 可以归到 Claude 身上。到了 2026 年第二季度,典型工程师每天合并的代码量,已经大约是 2024 年的 8 倍。
单看这个数字,很容易把文章理解成「程序员又要被替代了」。但我觉得只盯着代码,会看窄。代码只是最容易被看见的部分。更麻烦的是,Claude 不只是在补几行代码,它开始进入一个更完整的研发链条。
写代码,跑实验,做代码审查,排查事故,甚至给研究人员提供下一步方向建议。这些动作放在一起看,就不再是 Claude 帮人省一点时间,而是很多原来只能人慢慢推进的环节,开始被它接走一部分。
过去人类是主要执行者,AI 是辅助工具。现在很多任务会变成,人把目标说清楚,AI 先往前跑一段,人再回头看它有没有跑偏。
写代码这一步没那么稀缺以后,人就得回去干更烦的活了,判断它到底对不对。
执行便宜以后,麻烦才刚开始
这个感觉,我自己用 Codex 和 Claude Code 的时候也越来越明显。刚开始用 AI,你会特别兴奋。它写得快,改得快,整理资料也快。以前半小时写不出来的东西,现在几分钟就能吐出来一版。
但用久了以后,你会发现烦人的地方不在「它能不能产出」。烦在它产出的东西到底能不能信。它写了一篇文章,你要判断观点是不是站得住。它改了一段代码,你要判断有没有跑通。它给你做了一个流程,你要判断有没有遗漏边界。
AI 速度越快,这个问题越明显。因为产出太多了。以前人慢,慢本身就是一个天然刹车。现在 AI 一口气给你十个方案,二十段分析,三份版本。你看着很爽,但如果你没有验收标准,到头来只会被它的产出淹没。
Anthropic 文章里让我停住看的,也是这一点。Claude 不是单纯变强了。它把某个环节推快以后,麻烦会挪到下一个地方。
代码写得更快了,代码审查就更吃人。想法变多了,你得挑哪些值得做。实验跑得更快了,结果能不能信,还是得有人拍板。
这事离普通人不远。我们每天用 AI,也是在经历同样的事。
只会打开 AI,迟早不够用
这两年,很多人都在学 ChatGPT,学 Claude,学 Codex,学提示词,学自动化,学怎么让 AI 写文章,做 PPT,写代码,做图。
这些当然有用。我自己也一直在学,而且很多东西不学真的跟不上。但坦率的讲,只会打开 ChatGPT、Claude、Codex,迟早会变成基础操作。就像会用搜索,会用表格,会用文档。刚开始它是优势,后来别人会默认你就该会。
麻烦的地方在后面。你能不能把一个模糊目标拆成流程。你能不能判断哪些步骤适合交给 AI,哪些步骤必须人来把关。你能不能提前定义什么结果算好。你能不能发现 AI 产出里的漏洞。你能不能把一次跑通的经验,沉淀成下次还能复用的规则。
这些东西听起来不酷,也没有新模型发布那么热闹。但真到干活的时候,靠的就是这些。
因为当 AI 越来越会干活,人要补的就不是速度,而是让 AI 别干偏的本事。
企业缺的,不只是会玩 ChatGPT 的人
前两天我还看到一条挺戳我的观点,大意是,会用 AI 已经不稀奇了,更难的是把 AI 塞进业务里,真的跑起来。这句话我挺认同。
个人用 AI,很多时候是单点任务问题。你会不会问,能不能让 Claude 帮你省半小时,能不能把一篇文章写顺一点。但企业用 AI,就不是这么简单了。
老板说想提高效率,这句话没法直接丢给 Claude。客服说工单太多,销售说客户跟进慢,运营说复盘没人看,内容团队说素材太散。这些都不是一个聊天框能解决的。
这里要有人把目标翻译成步骤,把步骤拆成任务,把任务交给 AI,再把 AI 的结果拿回来验收。中间还绕不开员工负担,成本,权限,合规,谁负责背锅。
所以接下来很吃香的一类人,可能不是最会炫技的人,而是能站在业务和 AI 中间做翻译的人。他不一定是程序员。他可能是运营,产品,销售,客服,内容创作者,也可能就是一个普通职场人。
只要他懂业务,懂流程,也愿意搞清楚 AI 能做什么,不能做什么,他就有机会把 AI 从好玩的聊天框,变成真的能交活的东西。
普通人现在该练什么
如果把 Anthropic 这篇文章落到普通人身上,我会先练四件事。
第一件事,拆流程。别只问「Claude 怎么用」或者「Codex 怎么用」。多问一句,我手上这个工作,从开始到交付到底有几步。哪一步最重复,哪一步最容易出错,哪一步最适合交给 AI。你把流程拆清楚了,AI 才有地方接进去。
第二件事,定标准。AI 很擅长产出,但它不会天然知道你要的「好」是什么。一篇文章好不好,一个方案能不能用,一个页面算不算完成,一段代码有没有交付,都要有标准。没有标准,你就只能靠感觉改来改去。
第三件事,验结果。以后最危险的不是 AI 不会做,而是它做得太像那么回事。看起来顺,听起来对,格式也漂亮。但事实有没有错,逻辑有没有断,边界有没有漏,风险有没有被藏起来,都要人来查。
第四件事,沉淀规则。不要每次都重新教 AI。如果一个流程你跑通了,就把它写下来。如果一个坑你踩过两次,就把它变成检查项。如果一个任务经常重复,就把它做成模板,规则,甚至 Skill。
我最近整理素材库的时候,对这一点感受很深。很多时候不是 AI 不行,是我没有把什么放哪,怎么命名,何时归档,怎么检查这些规则提前说清楚。规则一乱,AI 就跟着乱。规则清楚一点,它才像个能交活的搭子。
分水岭,是你能不能验收
我以前也会有一个误区。看到新的 Claude 教程,就觉得自己得赶紧学。看到 Codex 又更新,就觉得又落后了。收藏一堆教程,到头来反而更焦虑。
但现在我会换一个问题问自己。这个东西能不能进入我的真实工作流。它能不能稳定帮我交付一个结果。我能不能判断它交付得对不对。如果不能,那它再热闹,也只是一个临时玩具。
Anthropic 这篇文章讲的是很大的未来,AI 可能开始参与构建下一代 AI。但落到我自己身上,问题反而很朴素。
AI 负责跑得快,人负责看它有没有跑偏。
以后更管用的,可能不是收藏最多教程,也不是最会写提示词。而是你能不能对 AI 说清楚目标,能不能验收它的结果,能不能把它接进真实工作里。
所以,别只盯着今天 Claude 又出了什么玩法,Codex 又加了什么功能。更重要的问题是,你能不能把 AI 变成自己的工作系统。
如果今天没有别的动作,你可以先做一件很小的事。拿出一个你最近反复做的工作,写下它从开始到交付的 5 个步骤,再标出来哪一步可以交给 AI,哪一步必须你亲自验收。
对了,我叫阿恒。
一个正在学习AI的普通人。
夜雨聆风