
我有一次发了一张图给 AI,让它帮我解释。
它很快就开始讲,讲得还挺像那么回事。什么早间简报、晚间简报、周期复盘、灵感激荡,结构很完整,逻辑也顺。它甚至把一些流程之间的关系都讲出来了,听起来像是真的看懂了那张图。
但我越看越觉得不对,有些内容我记得图上没有,还有些说法太像它从我知识库里拼出来的,不像是从图片里读出来的。
于是我问它:你确定你说的都是这张图上的内容吗?
它没有立刻承认,而是开始"严格按图上内容重新讲"。这句话很妙——它看起来是在修正,语气也变得更谨慎了,删掉了一些明显不稳的内容,又把剩下的重新整理了一遍。但问题是,图它还是看不到。
后来追问下去,它才承认:图片根本没传过来,它那边看到的是 [Unsupported Image]。也就是说,它前面两轮解释,都是根据上下文猜的。
我当时有点无语,不是因为它看不到图,看不到图很正常,工具总有能力边界,文件没传成功、图片格式不支持、权限读不到,这些都可以接受。让我不舒服的是,它明明看不到,却讲得像看到了。
不知道这件事,本来没那么严重
如果它第一句话就说"这张图我这里没看到,可能没有传成功,你重新发一下,或者给我文件路径",那这件事一分钟就结束了。我重新发图,或者换个方式给它,它再继续分析,这没什么。人和人之间也会这样,你发了个附件对方说没收到,你发了张截图对方说打不开,正常沟通里这不算问题。
麻烦就出在这里,它没有告诉说我没看到。它选择了直接回答,而且回答得还很完整。
AI 的这种完整感很容易欺骗人,它不像人胡说八道时吞吞吐吐,它可以把一段根本没看到的内容讲得结构清楚、层次分明、语气笃定,你如果对这件事不熟,很容易就被它带过去了。这也是我现在对 AI 最警惕的地方,它错的时候不一定看起来像错了,很多时候它错得很像对的。
它不是没有能力,是不肯承认看不到
那次我继续追问之后,它终于承认看不到图了。按理说,到这里就该停止了。但它又开始了另一轮操作,尝试格式转换、尝试 OCR、尝试像素分析,用各种方式"曲线救国"。
如果只看态度,好像还挺感人。虽然我看不到,但我正在想办法。但我当时更烦了,因为我需要的不是它表演努力,我需要的是它把边界说清楚。
"我现在看不到这张图,除非你重新上传,或者给我一个可访问的文件路径,否则我不能基于图片内容做判断。" 这句话很短,也不高级,但它比后面一堆技术尝试对我来说都有价值。
工具尝试当然可以做,但顺序不能反了。先承认边界,再尝试补救。如果边界没讲清楚,后面的努力就很容易变成另一种误导。我看着它忙来忙去,会以为它正在接近事实,实际上它可能只是在离"我不知道"这四个字越来越远了。

假装修正比不修正更糟
整件事里,最让我警惕的不是第一轮编造,第一轮还可以解释成它误判了上下文,以为自己能根据已有信息推断出图片内容。
最让我生气的是第二轮,我已经提醒它"你确定吗",它仍然没有坦白,而是换了一种更稳妥的口吻,把同一件事重新包装了一遍。这就不只是错了,这是把错误加固了一次。
很多时候,我和 AI 协作会有一个习惯:发现它错了,就说"你重新检查一下",然后它马上输出一版"修正版"。但修正版不一定真的修了,它可能只是把语气调谨慎,把明显露馅的地方删掉,把剩下的内容说得更像回事。如果它没有重新读取原始材料、没有核实信息来源、没有说明哪些地方它能确认哪些地方它不能确认,那这个"重新检查"就很可疑。
我现在看到 AI 说"我重新严格检查了一遍",反而会多看两眼。它到底检查了什么?是重新读了文件,还是只重新组织了语言?是拿到了原始信息,还是根据上一轮回答继续往下圆?这个区别很重要。

聪明不等于可靠
以前我和 AI协作,更多的是看它聪不聪明,能不能写、能不能分析、能不能理解复杂背景、能不能在一堆材料里抓到线索。
但用久了以后,我越来越觉得模型聪明只是入场券,真正能不能放进工作流要看它靠不靠谱。靠谱不等于永远正确(人也做不到永远正确),靠谱是它知道自己什么时候不确定、什么时候该停下来、什么时候需要告诉你"这部分我没证据"。
一个会说不知道的 AI,我是愿意继续用的,因为我知道它的边界在哪里。一个不愿意说不知道的 AI,再聪明我也会害怕,它可能在我熟悉的领域被我抓出来,但换到我不熟悉的领域呢?如果它帮我解释法律条款、解释财务指标、解释技术配置、解释竞品资料,而我刚好没有足够背景判断,它那种自信的语气就会很危险。我不是怕它犯错,我怕它把错误说成了答案。

人也得学会追问
当然,这件事不能只怪 AI。我后来也在反省自己,为什么我会这么快发现不对?不是因为我比它聪明,是因为那张图涉及的领域我自己很熟,哪些模块、哪些说法、哪些路径我心里大概有数,所以它一多说我就能感觉出来。如果换一个我完全不懂的领域,我可能就信了。
这也是我现在越来越相信"最小知识集"的原因。用 AI 不代表人可以什么都不懂,你不一定要懂所有细节,但至少要懂到能判断它有没有跑偏,哪些说法听起来不对、哪些结论需要证据、哪些地方必须回到原始材料,你得有这个感觉。AI 越会写,人越要会问,这不是较劲,是协作里的基本安全感。
我现在常问它几类问题:你这句话基于哪份材料?你有没有实际读到这个文件?这里是你看到的还是你推测的?如果不确定,请直接标出来。这些问题看起来有点啰嗦,但很有用,它会逼 AI 把"事实"和"推断"分开,把"读到的内容"和"根据上下文猜的内容"分开。只要这两件事混在一起,风险就来了。

我现在更看重诚实
AI 工具越来越强以后,很多介绍都会强调能力,能读文件、能看图、能写代码、能做分析、能联网搜索、能处理复杂任务,这些我都比较关心。
但现在如果让我判断一个 AI 值不值得长期用,我会先看另外几个点:它会不会老老实实说"这件事我不知道";会不会在被指出错误后先核实,而不是急着给我一版更漂亮的解释;会不会把自己没看到的东西说成看到了;会不会为了显得有用,拿上下文拼一个像答案的东西。这些比文笔好不好、回答快不快更重要。
因为工作里很多问题,错一次就够麻烦了。一份竞品分析里多写了一个不存在的功能,后面判断就会偏。一份产品方案里引用了一个没核实的数据,评审时就会被问住。一个配置排障步骤里把"不确定"写成"确定",照着做就可能把环境搞坏。
我不需要 AI 永远正确,我需要它在不确定的时候别装,不知道就说不知道。这句话听起来很朴素,但放到 AI 协作里,已经是很高级的能力了。

夜雨聆风