AI编程,从“炫技”卷到“交付”
以前我们看 AI 写代码,像看小孩背古诗。
“哇,它会写函数!”
“哇,它会修 Bug!”
“哇,它还会写注释!”
掌声雷动,亲戚群转发。
但真到了项目里,气氛马上变了:代码谁审?测试谁跑?上下文谁维护?发布挂了谁背锅?成本超了谁买单?密钥泄露了谁半夜惊醒?
所以,AI 会写代码,只是幼儿园毕业。
AI 能稳定交付,才算进了社会。
这次 Claude Opus 被拿来讨论长时间编码任务,重点不是“模型又变聪明了”,而是它开始像一个能持续推进任务的工程助理:自动权限、循环执行、云端运行、端到端验证。
听起来很美好,但老程序员都知道:最可怕的新人,不是不会干活,而是干得很勤快,但你不知道他改了哪里。
AGENTS.md 的研究也很扎心。很多人以为,给 AI 多塞点项目资料,它就能更懂你。结果自动生成的上下文文件,反而可能让成功率下降、成本上升。
这就像你给新员工发一本 300 页公司制度,然后期待他第二天独立交付。
他确实看了。但他也晕了。
上下文不是越多越好,而是越准越好。真正有用的 AGENTS.md,不是资料仓库,而是工程规则:目标是什么,目录怎么走,哪些文件别碰,测试怎么跑,什么时候必须停下来问人。
MIT 那组数据更值得警惕:AI 让代码编辑量明显增加,但最终发布提升有限。什么意思?键盘更响了,仓库更热闹了,但上线没快多少。
这提醒我们:代码量不是生产力。
很多时候,代码越多,债越厚。
Google 的 Colab CLI 也说明同一件事:Agent 不能永远困在聊天框里。真要干活,它要进终端、接算力、跑脚本、读文件、用云环境。聊天框是茶馆,终端才是工地。
再看 MiniMax M3 和 Claude 的代码审计对比,另一个问题浮出水面:同样抓 Bug,成本可能差很多。个人玩 AI 可以喊“最强模型给我上”,企业用 AI 必须多问一句:这活儿值不值?
未来模型选型不会只看谁最强,而是看谁在这个任务上 ROI 最好。老板不关心你用了多豪华的模型,老板只关心:花了多少钱,交了多少活。
最后是 Claude Code 漏洞。提示词注入、GitHub 自动化、敏感凭证,这些词放在一起,就已经不是“AI 幻觉”那么简单了。
当 AI 只能聊天时,说错话最多尴尬。
当 AI 能碰仓库、CI/CD、密钥和生产环境时,犯错就可能变事故。
所以今天这 7 件事真正说明的是:
AI 编程的上半场,拼会写;下半场,拼交付。
未来真正值钱的,不只是更强模型,而是上下文、流程、测试、成本、安全和权限这些工程系统。
夜雨聆风