这是 codedoctor 的第 54 原创内容
AI 时代的计算机常识课 · 第 08 篇 AI 幻觉不只是工具问题,提问方式、输入资料质量和上下文也会影响答案。 |
一个销售同事把三份客户表丢给 AI,让它算本月复购率。
AI 很快给了百分比,还写得特别肯定。
后来一查,同一个客户重复了两次,还有一张表是上月旧版。
这篇解决一个问题:AI 为什么会一本正经地错,普通人怎么检查结果?
AI 会出错,不只因为它“笨”,很多时候是你给它的资料本来就乱。
AI 最危险的回答,常常不是明显离谱,而是看起来像刚开完会整理出来的结论。
01 幻觉,不是 AI 故意撒谎
—

图解:AI 会根据当前资料生成答案,资料缺口越多,猜测越容易混进结果。
很多人第一次遇到 AI 幻觉,会很生气。
它明明说得那么肯定,为什么是错的?
先把一个误会放下。
AI 幻觉不等于 AI 在故意撒谎。
它没有人类那种“我知道这是假的,但我偏要骗你”的心理。
它更像一个非常会写总结的临时助理。
你给的资料不完整,它会补。
你给的来源不清楚,它会猜。
你问的问题太宽,它会按常见情况生成一个看起来顺的答案。
问题是,它生成得太像真的了。
这就容易让人放松警惕。
尤其是数字、法律、医疗、财务、合同、客户数据这类事情,AI 说得再像,也不能直接当最终结论。
先记这句话 AI 的语气不等于可信度,越像正式报告,越要看来源和计算过程。 |
02 资料脏了,AI 就更容易错
—

图解:重复、缺失、格式乱、标签错、版本旧,都会让 AI 的答案变形。
资料脏,不是说资料上有灰。
它指的是资料质量不干净。
比如客户表里同一个人出现两次。
表格里有空白行。
日期有的写 2026-06-08,有的写 6月8日。
金额有的带人民币符号,有的只是数字。
一份文件叫“最终版”,另一份叫“最终最终版”。
标签也可能错。
明明是已成交客户,却被标成待跟进。
明明是 2025 年数据,却混进 2026 年报表。
这些问题放在人眼里,已经够烦。
放到 AI 面前,它也会受影响。
你让 Claude 总结客户资料,它可能把重复客户当成两个客户。
你让 Codex 写脚本统计表格,它可能因为格式混乱读错列。
你让 Claude Code 根据旧报错修代码,它可能修的是已经不存在的问题。
AI 不是资料清洁工。
它可以帮你发现问题,但前提是你让它先检查资料质量,而不是直接要结论。
让 AI 先做这一步 请先检查这份资料里是否有重复、缺失、格式不一致、标签错误和版本混乱,再给结论。 |
03 上下文不清,回答也会飘
—

图解:旧文件、新文件、截图、口头要求混在一起,AI 很容易不知道该听谁的。
有时候资料本身没那么差,但同一个会话聊天里上下文很乱。
你一会儿说“按上周方案改”。
一会儿又发“客户刚说的新版要求”。
接着上传一张截图,却没说这张截图是旧版还是新版。
AI 看见一堆材料,会努力找关系。
但它不知道你心里哪份才是准的。
这就像你把三份会议纪要、两张截图、一段口头补充丢给同事,却不告诉他哪份优先。你的同事只能猜。
AI 在面临混乱语境里,也是靠猜测。
上下文不清,会让它把旧信息当新信息。
把背景资料当执行要求。
把示例当真实数据。
把你随口说的话当硬性规则。
所以和 AI 助手协作时,要学会给资料排序。
哪份是事实来源。
哪份只是参考。
哪份已经作废。
哪几个问题必须人工确认。
一个好习惯 发多份资料时,在开头写清楚:以哪份为准,哪些只是参考,哪些不要使用。 |
04 检查 AI 答案的 5 个动作
—

图解:来源、引用、交叉验证、反问 AI、人工复核,是检查 AI 输出的五个常用动作。
普通人不需要把 AI 研究明白,才敢用 AI。
但要学会检查。
第一,看来源。
让 AI 说清楚它依据哪份资料、哪一页、哪一列、哪一段。
第二,要引用。
让它把关键判断旁边标出原文或数据位置。
第三,交叉验证。
同一个结论,至少拿另一份资料、另一个工具或人工计算再看一眼。
第四,反问 AI。
让它列出自己最不确定的三点。
让它说出可能错在哪里。
第五,人工复核。
尤其是要对外发送、给老板汇报、影响客户和金钱的内容,一定要人看。
这个流程不麻烦。
比事后发现发错报告、算错金额、引用错政策要省时间。
可以直接复制给 AI 请按“结论、依据、引用位置、不确定点、需要人工复核的地方”五栏输出。 |
05 让 AI 少错,从整理资料开始
—

图解:先清资料、标来源、说明边界,再让 AI 输出结论。
很多人把 AI 当成最后一个步骤。
资料乱了,就让 AI 整。
表格乱了,就让 AI 算。
需求乱了,就让 AI 写。
这当然可以试。
但更稳的做法,是先让 AI 做资料体检。
比如先问它:这几份资料之间有没有冲突?
有没有重复数据?
有没有缺失字段?
有没有格式不统一?
有没有看起来像旧版本的文件?
等这些问题先被列出来,再进入总结、计算、写报告。
你还可以把资料分成三类。
事实来源。
参考材料。
个人猜想。
这样 AI 就不容易把猜想写成事实。
它能帮你跑得快,但你要先把路面扫一遍。
资料输入模板 本次任务以 A 文件为准,B 文件只作参考,C 文件已经作废。请先检查数据质量,再给结论。 |
06 这和 AI 有什么关系?
—
AI 的回答质量,和模型能力有关,也和资料质量有关。
脏数据、缺失数据、重复数据、格式混乱、标签错误,都会影响 AI 判断。
Codex、Claude、Claude Code 这类工具也是一样。
你给它旧文件,它可能按旧逻辑改。
你给它不完整报错,它可能猜错原因。
你不给引用和来源,它可能把看起来合理的话写成结论。
所以会用 AI,不是只会提问,还要会整理输入、标明来源、要求引用、保留人工复核。
07 这一篇顺手认识几个 AI 词
—
第 08 篇 AI 关键词卡 幻觉:AI 生成了看起来合理但实际不准确的内容。 脏数据:重复、缺失、格式乱、标签错、版本旧等质量不好的资料。 缺失数据:该有的信息没有出现,比如日期、金额、客户状态缺失。 标签错误:资料被分错类,比如把已成交客户标成待跟进。 上下文:AI 当前能看到的任务背景、文件、对话和限制。 交叉验证:用另一份来源、另一个工具或人工方法再核对一次。 |
08 先收藏这八句话
—
第 08 篇 收藏清单 1. AI 幻觉不是简单撒谎,而是生成机制带来的风险。 2. AI 的语气越肯定,越要看来源和依据。 3. 重复数据会让统计结果变大。 4. 缺失数据会让 AI 补猜。 5. 格式混乱会让 AI 读错列、读错时间、读错金额。 6. 上下文不清会让 AI 把旧资料当新要求。 7. 检查 AI 结果,要看来源、引用、交叉验证、反问不确定点。 8. 对外发送、涉及钱和客户的内容,一定人工复核。 |
下篇预告 AI 不只会聊天了:Agent 到底能替你做什么? 下一篇,我们讲 AI Agent:一个会定目标、列计划、调用工具、执行任务、再根据结果调整的 AI 助手。 |
——————————————————
公众号:荒岛书生 codedoctor
视频号:荒岛书生 codedoctor
小红书:codedoctor
Token消耗大户,每天对着麦克风和 Claude / Codex AI 智能体交流。 AI 时代的计算机常识课持续更新中 |
夜雨聆风