AI编程,从“炫技”卷到“交付”

AI编程，从“炫技”卷到“交付”

以前我们看 AI 写代码，像看小孩背古诗。
“哇，它会写函数！”
“哇，它会修 Bug！”
“哇，它还会写注释！”
掌声雷动，亲戚群转发。
但真到了项目里，气氛马上变了：代码谁审？测试谁跑？上下文谁维护？发布挂了谁背锅？成本超了谁买单？密钥泄露了谁半夜惊醒？

所以，AI 会写代码，只是幼儿园毕业。
AI 能稳定交付，才算进了社会。

这次 Claude Opus 被拿来讨论长时间编码任务，重点不是“模型又变聪明了”，而是它开始像一个能持续推进任务的工程助理：自动权限、循环执行、云端运行、端到端验证。

听起来很美好，但老程序员都知道：最可怕的新人，不是不会干活，而是干得很勤快，但你不知道他改了哪里。

AGENTS.md 的研究也很扎心。很多人以为，给 AI 多塞点项目资料，它就能更懂你。结果自动生成的上下文文件，反而可能让成功率下降、成本上升。
这就像你给新员工发一本 300 页公司制度，然后期待他第二天独立交付。
他确实看了。但他也晕了。

上下文不是越多越好，而是越准越好。真正有用的 AGENTS.md，不是资料仓库，而是工程规则：目标是什么，目录怎么走，哪些文件别碰，测试怎么跑，什么时候必须停下来问人。

MIT 那组数据更值得警惕：AI 让代码编辑量明显增加，但最终发布提升有限。什么意思？键盘更响了，仓库更热闹了，但上线没快多少。
这提醒我们：代码量不是生产力。
很多时候，代码越多，债越厚。

Google 的 Colab CLI 也说明同一件事：Agent 不能永远困在聊天框里。真要干活，它要进终端、接算力、跑脚本、读文件、用云环境。聊天框是茶馆，终端才是工地。

再看 MiniMax M3 和 Claude 的代码审计对比，另一个问题浮出水面：同样抓 Bug，成本可能差很多。个人玩 AI 可以喊“最强模型给我上”，企业用 AI 必须多问一句：这活儿值不值？

未来模型选型不会只看谁最强，而是看谁在这个任务上 ROI 最好。老板不关心你用了多豪华的模型，老板只关心：花了多少钱，交了多少活。

最后是 Claude Code 漏洞。提示词注入、GitHub 自动化、敏感凭证，这些词放在一起，就已经不是“AI 幻觉”那么简单了。

当 AI 只能聊天时，说错话最多尴尬。
当 AI 能碰仓库、CI/CD、密钥和生产环境时，犯错就可能变事故。

所以今天这 7 件事真正说明的是：
AI 编程的上半场，拼会写；下半场，拼交付。
未来真正值钱的，不只是更强模型，而是上下文、流程、测试、成本、安全和权限这些工程系统。

名称已清空

微信扫一扫赞赏作者

喜欢作者其它金额

赞赏后展示我的头像

作品

暂无作品

喜欢作者

其它金额

最低赞赏 ¥0

其它金额

赞赏金额

最低赞赏 ¥0

收录于AI观察站

湖南,2小时前,