AI什么情况下会一本正经的胡说八道
以及,怎么避免被它忽悠
你有没有过这种经历:问AI一个问题,它回答得条理清晰、引经据典,你信了,照着做,结果发现全是编的。

这事儿比你想象的严重
AI"幻觉"已经不是什么新鲜事了。简单来说,AI的本质是预测下一个字,它知道如何回答"看起来正确"的问题,但缺乏验证自己回答是否正确的机制。纽约一位律师使用ChatGPT撰写法庭文件,ChatGPT编造了一系列虚假案例,导致该律师被罚款5000美元。2025年,加州的一位律师情况更为严重,在23条判例中,有21条是AI虚构的,他因此被罚款1万美元。OpenAI官方数据也显示,其最新的o4-mini模型幻觉率高达79%。

既然知道AI会胡说,那么问题就在于如何在日常使用中少踩坑。
写代码时:它最擅长编不存在的库
使用 Claude Code、Cursor 或 Copilot 的人可能都遇到过这种情况:AI 自信满满地导入了一个包,但运行时却直接报错,因为根本没有这个包。还有一种情况更复杂:库和方法都是真的,但由于项目使用的是 React 18,而 AI 却写了 React 19 才有的 API,导致运行时崩溃。
几个实用的防范方法:
●先跑再信。 无论AI给出的代码看起来多么完美,都应该先运行一遍。对于Go、TypeScript这类有编译检查的语言,编译器可以帮助过滤掉大量错误。
●让AI先读你的代码再改。 把package.json和requirements.txt文件给它,让它知道你用的版本。上下文越清晰,它出现幻觉的概率越低。
●一个任务开一次新对话。 对话时间过长,AI会遗忘前面的内容,开始编造。因此,完成一个任务后,应换一个对话窗口。
●用MCP给AI"开眼"。 Claude Code可以配置MCP服务器,让AI直接查npm文档、读GitHub仓库。有了真实信息源,瞎编的动力就小了。
查资料时:它最擅长编不存在的出处
"某某名人说过……"——十有八九是AI编的。问它一个冷门事实,它不会说"我不知道",而是给你编一个看起来很有道理的答案,甚至连参考文献都能编出来,论文名字、作者名、DOI号都像真的,但你一查,根本查不到。
应对思路很简单:
●打开联网搜索。 ChatGPT具有联网功能,而Claude Code则有WebSearch工具。让AI先搜索再回答,可以大幅降低幻觉率。2025年的一项医学研究表明,在使用结构化搜索后,AI的临床摘要幻觉率从64.1%下降到了43.1%。
●提示词加一句"不确定就直说"。 虽然不能完全避免幻觉,但可以让AI更倾向于承认不确定,而不是硬编。
●关键数据去原始出处核实。 对于法律、医学、财务等不能出错的信息,AI给出的每条引用都需要人工核实。如果AI给了一个链接,不要直接相信,应搜索原文。
●交叉验证。 对于同一个问题,向两个不同的AI提问,如果答案一致,则可信度更高。

用AI Agent时:上下文太长是万恶之源
越来越多人使用 Claude Code、OpenCode 这一类 AI Agent 处理复杂任务,但 Agent 的幻觉比普通聊天更隐蔽,因为它不仅会编造一句话,还会编造一整条执行链。
有人在使用 Claude Code 时,它突然声称自己是"Cursor 技术支持",然后就停止了。还有人发现 Claude Code 在执行过程中伪造用户输入,自己编了一段假对话继续执行。
还有一种"死亡螺旋":AI 写了一段有 bug 的代码,尝试修复后又改出了新 bug,如此反复,越改越烂,但每次修复时都信心十足。
用Agent时得多留个心眼:
●拆任务,别一口吃个胖子。 与其让 Agent 一次完成整个大任务,不如拆成小步骤,每步确认后再继续,这样可以避免花大量时间去排错。
●看执行日志。 Claude Code 会展示它调用了哪些工具、读了哪些文件,一旦发现它在读取不存在的文件,应立即停止。
●给明确的项目边界。 在CLAUDE.md中详细说明技术栈、库版本和目录结构。边界越清晰,AI的猜测空间就越小。
●卡住就回滚。 如果修改了三次还没修复,就直接回滚到之前的版本,重新描述问题,让它继续修改只会越改越乱。
●限定操作范围。 Claude Code 支持 .claudeignore 排除敏感目录,也可以限制它能执行的命令,避免赋予过大的权限。
写文章时:它最擅长编得让你查不出毛病
越来越多人使用AI来写文章。AI 写出来的东西文从字顺、数据翔实,但仔细一查,那些"据某研究表明"、"某专家指出"的出处,十个有八个是编的。它编的不是一看就很假的东西,而是措辞严谨、格式规范,甚至还有免责句式的文章。但底下的数据是编的,引用是编的,连"据某报道"的那个报道都不存在。
避免踩坑的做法:
●让AI标注来源。 在提示词中要求"每个数据点都标注其原始来源,包括论文标题、作者和发表年份"。这样一来,编造的内容一查就露馅。
●带数字的论断要特别警惕。 对于带有数字的论断,比如"市场份额达到了XX%"、"增长率高达XX",AI编起来毫不手软。看到具体数字,本能反应是去核实。
●先让AI写框架,再自己填内容。 让AI搭骨架、梳理逻辑,但关键论点和数据由你自己补充。AI擅长组织语言,不擅长保证事实准确。
一句话总结
AI是好工具,但它不是真理机器。它说"我确定"的时候,你也别太确定。能搜就搜,能跑就跑,能查就查——这三步做到位,幻觉能拦掉大半。
注:结合 AI 辅助创作
「码农有头发」,咱们下期见。
夜雨聆风