AI 胡说八道?很多时候是你不会提问,输入资料太乱了

这是 codedoctor 的第 54 原创内容

AI 时代的计算机常识课 · 第 08 篇

AI 幻觉不只是工具问题，提问方式、输入资料质量和上下文也会影响答案。

一个销售同事把三份客户表丢给 AI，让它算本月复购率。

AI 很快给了百分比，还写得特别肯定。

后来一查，同一个客户重复了两次，还有一张表是上月旧版。

这篇解决一个问题：AI 为什么会一本正经地错，普通人怎么检查结果？

AI 会出错，不只因为它“笨”，很多时候是你给它的资料本来就乱。

AI 最危险的回答，常常不是明显离谱，而是看起来像刚开完会整理出来的结论。

01 幻觉，不是 AI 故意撒谎

—

图解：AI 会根据当前资料生成答案，资料缺口越多，猜测越容易混进结果。

很多人第一次遇到 AI 幻觉，会很生气。

它明明说得那么肯定，为什么是错的？

先把一个误会放下。

AI 幻觉不等于 AI 在故意撒谎。

它没有人类那种“我知道这是假的，但我偏要骗你”的心理。

它更像一个非常会写总结的临时助理。

你给的资料不完整，它会补。

你给的来源不清楚，它会猜。

你问的问题太宽，它会按常见情况生成一个看起来顺的答案。

问题是，它生成得太像真的了。

这就容易让人放松警惕。

尤其是数字、法律、医疗、财务、合同、客户数据这类事情，AI 说得再像，也不能直接当最终结论。

先记这句话

AI 的语气不等于可信度，越像正式报告，越要看来源和计算过程。

02 资料脏了，AI 就更容易错

—

图解：重复、缺失、格式乱、标签错、版本旧，都会让 AI 的答案变形。

资料脏，不是说资料上有灰。

它指的是资料质量不干净。

比如客户表里同一个人出现两次。

表格里有空白行。

日期有的写 2026-06-08，有的写 6月8日。

金额有的带人民币符号，有的只是数字。

一份文件叫“最终版”，另一份叫“最终最终版”。

标签也可能错。

明明是已成交客户，却被标成待跟进。

明明是 2025 年数据，却混进 2026 年报表。

这些问题放在人眼里，已经够烦。

放到 AI 面前，它也会受影响。

你让 Claude 总结客户资料，它可能把重复客户当成两个客户。

你让 Codex 写脚本统计表格，它可能因为格式混乱读错列。

你让 Claude Code 根据旧报错修代码，它可能修的是已经不存在的问题。

AI 不是资料清洁工。

它可以帮你发现问题，但前提是你让它先检查资料质量，而不是直接要结论。

让 AI 先做这一步

请先检查这份资料里是否有重复、缺失、格式不一致、标签错误和版本混乱，再给结论。

03 上下文不清，回答也会飘

—

图解：旧文件、新文件、截图、口头要求混在一起，AI 很容易不知道该听谁的。

有时候资料本身没那么差，但同一个会话聊天里上下文很乱。

你一会儿说“按上周方案改”。

一会儿又发“客户刚说的新版要求”。

接着上传一张截图，却没说这张截图是旧版还是新版。

AI 看见一堆材料，会努力找关系。

但它不知道你心里哪份才是准的。

这就像你把三份会议纪要、两张截图、一段口头补充丢给同事，却不告诉他哪份优先。你的同事只能猜。

AI 在面临混乱语境里，也是靠猜测。

上下文不清，会让它把旧信息当新信息。

把背景资料当执行要求。

把示例当真实数据。

把你随口说的话当硬性规则。

所以和 AI 助手协作时，要学会给资料排序。

哪份是事实来源。

哪份只是参考。

哪份已经作废。

哪几个问题必须人工确认。

一个好习惯

发多份资料时，在开头写清楚：以哪份为准，哪些只是参考，哪些不要使用。

04 检查 AI 答案的 5 个动作

—

图解：来源、引用、交叉验证、反问 AI、人工复核，是检查 AI 输出的五个常用动作。

普通人不需要把 AI 研究明白，才敢用 AI。

但要学会检查。

第一，看来源。

让 AI 说清楚它依据哪份资料、哪一页、哪一列、哪一段。

第二，要引用。

让它把关键判断旁边标出原文或数据位置。

第三，交叉验证。

同一个结论，至少拿另一份资料、另一个工具或人工计算再看一眼。

第四，反问 AI。

让它列出自己最不确定的三点。

让它说出可能错在哪里。

第五，人工复核。

尤其是要对外发送、给老板汇报、影响客户和金钱的内容，一定要人看。

这个流程不麻烦。

比事后发现发错报告、算错金额、引用错政策要省时间。

可以直接复制给 AI

请按“结论、依据、引用位置、不确定点、需要人工复核的地方”五栏输出。

05 让 AI 少错，从整理资料开始

—

图解：先清资料、标来源、说明边界，再让 AI 输出结论。

很多人把 AI 当成最后一个步骤。

资料乱了，就让 AI 整。

表格乱了，就让 AI 算。

需求乱了，就让 AI 写。

这当然可以试。

但更稳的做法，是先让 AI 做资料体检。

比如先问它：这几份资料之间有没有冲突？

有没有重复数据？

有没有缺失字段？

有没有格式不统一？

有没有看起来像旧版本的文件？

等这些问题先被列出来，再进入总结、计算、写报告。

你还可以把资料分成三类。

事实来源。

参考材料。

个人猜想。

这样 AI 就不容易把猜想写成事实。

它能帮你跑得快，但你要先把路面扫一遍。

资料输入模板

本次任务以 A 文件为准，B 文件只作参考，C 文件已经作废。请先检查数据质量，再给结论。

06 这和 AI 有什么关系？

—

AI 的回答质量，和模型能力有关，也和资料质量有关。

脏数据、缺失数据、重复数据、格式混乱、标签错误，都会影响 AI 判断。

Codex、Claude、Claude Code 这类工具也是一样。

你给它旧文件，它可能按旧逻辑改。

你给它不完整报错，它可能猜错原因。

你不给引用和来源，它可能把看起来合理的话写成结论。

所以会用 AI，不是只会提问，还要会整理输入、标明来源、要求引用、保留人工复核。

07 这一篇顺手认识几个 AI 词

—

第 08 篇 AI 关键词卡

幻觉：AI 生成了看起来合理但实际不准确的内容。

脏数据：重复、缺失、格式乱、标签错、版本旧等质量不好的资料。

缺失数据：该有的信息没有出现，比如日期、金额、客户状态缺失。

标签错误：资料被分错类，比如把已成交客户标成待跟进。

上下文：AI 当前能看到的任务背景、文件、对话和限制。

交叉验证：用另一份来源、另一个工具或人工方法再核对一次。

08 先收藏这八句话

—

第 08 篇收藏清单

1. AI 幻觉不是简单撒谎，而是生成机制带来的风险。

2. AI 的语气越肯定，越要看来源和依据。

3. 重复数据会让统计结果变大。

4. 缺失数据会让 AI 补猜。

5. 格式混乱会让 AI 读错列、读错时间、读错金额。

6. 上下文不清会让 AI 把旧资料当新要求。

7. 检查 AI 结果，要看来源、引用、交叉验证、反问不确定点。

8. 对外发送、涉及钱和客户的内容，一定人工复核。

下篇预告

AI 不只会聊天了：Agent 到底能替你做什么？

下一篇，我们讲 AI Agent：一个会定目标、列计划、调用工具、执行任务、再根据结果调整的 AI 助手。

——————————————————

公众号：荒岛书生 codedoctor

视频号：荒岛书生 codedoctor

小红书：codedoctor

Token消耗大户，每天对着麦克风和 Claude / Codex AI 智能体交流。

AI 时代的计算机常识课持续更新中