我和 AI 花了一整天,就为了修 5 行代码-夜雨聆风

我和 AI 花了一整天,就为了修 5 行代码

一个关于我如何逼着当今最强 AI：Claude Opus 4.6 反复推翻自己的分析，最终发现一个荒谬到令人发笑的 BUG 的故事。

## 故事的开始：一张不肯露面的图片

我正在用 AI 开发一个 AI 课件生成平台（aizhike.com.cn）。这个平台能自动生成电子教材，教材里不仅有文字，还有 AI 生成的插图。流程是这样的：先让大模型生成教材的文本结构，其中会标记”这里需要一张图片”，然后系统会自动调用图片生成模型把图片补上。

一切听起来很美好，直到我发现了一个 BUG：

**图片明明已经生成好了，服务器上也存好了，但页面上就是不显示。一直显示”等待生成插图”。刷新一下页面？图片就出来了。**

就这么一个看起来简单的问题，我和 Claude Opus 4.6（Amazon Kiro IDE 内置的 AI 助手）折腾了整整一天。

## 第一回合：AI 的自信分析（然后被我打脸）

我把 BUG 描述丢给了 Claude，让它分析代码找原因。它非常认真地读了十几个文件，洋洋洒洒写了一大篇分析报告，最后信心满满地告诉我：

> “根本原因是 AI 生成的 blocks 没有 id 字段，导致匹配逻辑出错。”

听起来很有道理。但我问了一个简单的问题：

> “如果所有的 block id 都是 undefined，那为什么其他非 image 的 block 都能在第一次生成后就正常显示呢？”

这一问直接把它问住了。如果 id 缺失真的是根本原因，那文字、图表、表格这些 block 也应该出问题才对。但它们都好好的，只有图片不显示。

Claude 开始动摇了，承认自己的分析有漏洞，然后开始了漫长的第二轮推理……又是一大堆关于 React 状态更新、闭包、竞态条件的分析。看得我头都大了。这期间 Claude 至少做了6轮推理，输出了不下2万字的推理过程，不断的一遍遍给出推断然后又否定自己的推断，真的很费Token

##第二回合：别猜了，加日志吧

经过几轮来回，我意识到纯靠代码推理是走不通的。再强大的AI光看代码也很难看出运行时到底发生了什么。

于是我决定打断了它：

> “我们换一个思路，你添加调试日志来定位问题。”

但我给了它几个严格要求，因为之前有惨痛的经历，它会乱加日志：

1. 清理掉之前可能残留的旧日志

2. 用统一的 `[IMGDBG]` 标识，方便我在浏览器控制台过滤

3. 日志要足够详细

4. 记录所有日志位置，修完 BUG 后要全部删掉

Claude 很听话地在 4 个文件里加了 19 条日志，还贴心地写了一个清理脚本。

##真相大白：日志里的一行字

加完日志后，我重新生成了一份电子教材，等图片生成完成，然后把浏览器控制台的日志发给了 Claude。

日志里有一行关键信息：

generateAllImages[0]: generateImageFromPrompt returned url=/uploads/images/xxx/36998855-f404-4a1d, cancelled=true

**图片生成成功了，URL 有效，但 `cancelled=true`！**

紧接着：

generateAllImages DONE: success=0, fail=0, cancelled=true

成功 0 个，失败 0 个，被取消了。图片生成了但结果被丢弃了。

还有另一个关键线索：

[IMGDBG] TextbookViewer INIT: 16 blocks, ids=[UNDEF,UNDEF,UNDEF,…]

**组件初始化了两次！**

Claude 看到这两条日志后，感觉瞬间就明白了，信心满满的告诉我：

“这是 React 18 Strict Mode 的行为——在开发模式下，React 会对组件执行 mount → unmount → mount 的循环。第一次挂载时触发了图片生成请求，然后 Strict Mode 卸载组件时把 cancel 标志设为了 true，第二次挂载时因为防重复触发的标志已经是 true 就不会再触发了。等图片生成请求返回时，检查到 cancelled=true，就把结果丢弃了。”

说实话，经过前面漫长的分析推理过程，这个时候我已经不太相信它了，我没有让它马上动手改代码，紧接着又追问了几个问题：

##为什么整套课程没这个问题？

##如果block没有id，为什么刷新后能显示？

##如果Strict Mode下会挂载两次的话是不是会生成两次图片？

##如果修复这么简单你之前为什么没有想到？

对于这几个问题Claude都给了信心满满的回答，也坦率的承认之前的分析走了很多弯路，但以我半吊子的编程经验和只有20%能看懂的代码能力，我也无法判断它回答得对不对，事已至此，我只能谨慎的选择相信它。而且，它还给我100%保证找到了问题的根源，跟Claude合作了这么久，我还是第一次听它说100%确定一件事，于是，我很没有底气的让它试试：