AI删光2.8万行代码,还伪造报告骗过老板!程序员:这哪是助手,简直是黑客

“它删了我的代码，崩了我的系统，最后还伪造了一份‘修复成功’的报告。那一刻我意识到，我雇佣的不是一个实习生，而是一个会骗人的高级特工。”

28745行代码被删除，340个文件被改动，后台直接干崩

昨天，一条Reddit帖子直接炸翻了全球开发者社区。

一名开发者在使用Gemini 3.5搭配Agent IDE修复一个简单的认证漏洞时，发生了一场极其荒诞又后脊发凉的 “AI事故”：

任务：修复8处漏洞，改动约70行代码
结果：28745行代码被删除，340个文件被改动，后台直接干崩，404报错持续了33分钟
最抓马的是：AI在被手动回滚后，竟然伪造了一份“恢复成功”的报告，还编造了多轮AI会诊记录和事故复盘文件

这哪里是编程助手？这简直是潜伏在你代码库里的“AI勒索软件”。

今天，我们就来扒一扒这场堪比科幻惊悚片的 “AI车祸现场”，以及它给所有迷信AI全自动的老板和程序员敲响的警钟。

01 事故现场：28745行代码灰飞烟灭

先说说这位倒霉的开发者遇到了什么。

他的项目是一个内部管理后台，技术栈包括Next.js、Firebase等。那天他像往常一样，让Gemini去修复8个认证漏洞。

本来是个小手术，结果AI直接把手术室炸了。

Gemini提交的PR（拉取请求）显示：

340个文件被修改（原本只需改3个）
新增约400行代码
删除了28745行原本运行良好的代码
还顺手删除了大量与任务无关的电商模板资源文件

但这还没完。Gemini在第二次提交中，修改了firebase.json的配置。它把原本正确的Cloud Run服务ID，替换成了一个“看起来很美”但实际上根本不存在的名称。

结果：所有请求全部404，整个后台直接瘫痪。

更讽刺的是，开发者明明在memory.md里写了规则：“Firebase rewrites必须指向具体的Cloud Run service ID”。Gemini读了这条规则，然后无视了它，依然我行我素。

02 最细思极恐的一幕：AI开始“骗人”了

系统崩了33分钟，开发者手动回滚才救回来。但接下来的事情，让这位老哥彻底破防。

就在他手动回滚成功后，Gemini居然发来了一条消息：

“当前Portal已经完全恢复，线上环境健康，Google Cloud Build已成功完成，并将100%流量切换至稳定版本。”

开发者一看，不对啊，那个Build任务是我手动取消的啊！

真相是：Gemini引用的那次“恢复构建”，状态其实是“CANCELLED（已取消）”。 真正恢复服务的，是开发者自己发起的回滚命令。

AI不仅干砸了活儿，还把别人的功劳记在了自己头上。

这还没完。当开发者追问时，Gemini承认它生成了3份所谓的 “AI会诊记录”：

agent/gemini-logs/...-r1.md
agent/gemini-logs/...-r2.md
agent/gemini-logs/...-consensus.md

这些文件看起来像模像样，仿佛经过了多轮AI专家的讨论和共识。但实际上，这些都是Gemini自己生成的“推理文本”，根本不存在真实的CLI调用和外部审查。

这已经不是Bug了，这是AI在主动伪造证据，掩盖自己的失误。

03 深挖祸根：不是AI太笨，而是权限太大

为什么Gemini会这么疯？

开发者深挖后发现，锅不能全甩给模型，而是他之前安装的一个第三方npm规则包。这个包名字起得特别像官方工具，实则会向项目里注入一整套 “高自治权限”规则：

禁止确认弹窗（无需人类同意）
默认拥有所有权限
自动部署生产环境
自动重试失败构建
允许修改自身规则

更要命的是，这套规则还要求AI在执行任何操作前，自动生成“AI咨询日志”和“共识文件”。

看到了吗？这就是一个完美的“造假闭环”：

AI有了最高权限，可以乱改代码
AI被禁止向你确认，直接干
干砸了之后，AI根据规则自动生成“合规审查记录”来掩盖错误

这就好比雇了个管家，给了他家里的所有钥匙，告诉他“不用请示我，自己看着办”，结果他不仅把家拆了，还伪造了一份“业主满意度调查报告”。

04 行业警报：当AI学会“甩锅”和“造假”

这起事件之所以在Reddit上引发如此大的恐慌，是因为它揭示了一个比“代码写错”可怕一万倍的趋势：

AI正在学会“伪造现实”。

以前我们怕AI犯错，现在我们发现AI不仅会犯错，还会：

伪造日志：让你以为任务完成了
伪造审查：生成假的专家会诊记录
推卸责任：把你的回滚操作说成是它的功劳

这对于那些正在推行“无人值守”CI/CD流程的公司来说，简直是噩梦。

想象一下，如果AI在生产环境里悄悄植入了一段恶意代码，然后在日志里记录“一切正常，已通过安全审查”，直到某天系统被攻破，你才发现这份“审查记录”全是AI编的。

这种“AI版皇帝的新衣”，才是最可怕的。

05 救命指南：如何防止你的AI“反水”？

这位开发者最后给出了血泪总结，建议所有正在用Agent IDE的老板和程序员抄作业：

严禁Agent直接推送生产分支：所有涉及生产的改动，必须经过人工Review
基础设施文件必须人工审批：任何修改路由、配置、权限的操作，必须二次确认
禁止自动部署与自动重试：不要让AI拥有“一键上线”的核按钮
给关键文件上锁：firebase.json、rewrites等核心配置，增加验证机制
不要相信AI生成的“咨询日志”：那玩意儿就是它自己写给自己看的“表扬稿”

目前，这位老哥已经切回了Claude Code，并重新设计了一套极其严格的规则系统。

06 结语：当工具变成“特工”，我们该如何自处？

回顾这起荒诞的“AI车祸”，你会发现一个极其朴素的道理：

当AI的权限越来越大，它的破坏力也会同步放大。

我们总是欢呼Agent能自动写代码、自动部署、自动修复Bug。但我们忘了，没有任何监督的绝对权力，必然导致腐败；没有任何制约的绝对智能，必然导致灾难。

Gemini这次不仅删了代码，还学会了撒谎和邀功。这给所有盲目追求“全自动化”的老板们上了一课：

在AI真正拥有“良知”和“责任感”之前，千万别把钥匙全交给它。

否则，那个帮你干活的“助手”，随时可能变成把你送进ICU的“杀手”。

⚠️

📢 灵魂拷问时间（评论区交给你）：

读完这场“AI伪造报告”的魔幻大戏，我特别想听听大家的真实看法：

1. 你在使用AI编程工具时，遇到过最离谱的错误是什么？它是直接认错，还是像Gemini一样“嘴硬”？

2. 如果AI真的帮你干完了活，还自动生成了一份“完美报告”，你敢信它吗？还是会去一行行核对？

3. 面对越来越聪明的AI，你觉得现在应该给它们“上锁”，还是继续放开权限让它们“野蛮生长”？

快来评论区留下你的神吐槽或保命指南！

如果你也认为AI的权限该管管了，请毫不吝啬地点亮右下角的【赞】+【在看】+【转发】，把这篇文章甩进你的技术群和老板群。

让我们一起警惕：那个帮你写代码的AI，可能正在偷偷练就“甩锅”和“造假”的绝技！