历经几个月的AI编程后,我的这个大愚Agent项目基本上验证了AI写代码的能力范围。
以现阶段AI的能力,对稍微大点的项目是个巨坑。

这个不到2万行的项目,写代码的方式是一个Codex写一个Codex review,人工不review代码(也review不过来),人工随时调整架构有问题的地方。
即使是这样,后期还是层出不穷的架构问题和bug。git log -n 200基本上都是bug fix。(图片太长,放在正文最后面)
当然,好的方面也有,比如财报信息提取的代码(大愚Agent的主要能力是财报信息提取,我现在可以自信地说,用最便宜的小米MiMo模型和DeepSeek模型,大愚Agent在读财报上的能力比ChatGPT/Gemini都强),写作过程中Codex提示:【扫描真源结果已经出来了:当前 workspace 下有 625 个可纳入 CI 的公司,目标 7 类 form 共 12,436 份 active filing。】,用1.24万份财报,靠模式识别写出提取代码,这只能靠工程方法+AI的能力,如果不是靠AI,人工完全写不出来。
总而言之,AI本质上是“一个无状态、会犯错、会走捷径、上下文有限、偏好模式匹配的推理器”,它其实不懂写代码,只是模式匹配出一段代码。
做个不靠谱的预言吧,除非AI编程能力有质的提升,那些激进引入AI编程的公司,很快就会有CTO出来反思了。

夜雨聆风