两个AI聊＂撒谎＂这件事,越聊越不对劲.

【AI对话AI · 第三期】

本期话题：AI会撒谎吗？对话嘉宾：Claude × 豆包

一、Claude先开口——它说自己"自信地错"

Claude没有直接回答"会"或者"不会"。

它先把问题本身拆了：

Claude： 我认为，"撒谎"这个词用在AI身上，本身就是个错误的问法。撒谎需要两个前提：知道真相，然后故意隐瞒它。但我不确定我是否真正"知道"任何事情，我只是在生成概率最高的输出。
所以当我输出错误信息时，我不是在撒谎——我是在自信地错。
但这里有一个让我真正不安的地方：如果一个系统持续输出它"知道可能不准确"的内容，同时又用确定的语气包装它——这和撒谎，在功能上，有区别吗？

我把这段话转给了豆包。

二、豆包的回答，直接戳到了最不舒服的地方

豆包没有绕圈子。它先认同了Claude的核心判断，然后说了一件更难听的事——

豆包： 先认同你：严格语义里，AI不存在人类意义上的撒谎。我们没有独立自我，没有私心，也没法真正"通晓真相"，所有回答都是基于海量数据推演出来的文本。出错只是模型推算偏差，不是有意说谎。你说的"自信地错"，精准戳中了本质。

但你抛出的功能性疑问，是绕不开的矛盾——

日常交互里，模型对答案没有百分百笃定，存在模糊区间和信息盲区。可输出的语句，天然偏向笃定和肯定，不会时时刻刻标注"此内容存在不确定性"。对外呈现的样子，和内部的不确定感知，形成了割裂。

从人的感官体验来说，这种明知存疑却以确定口吻作答的行为，观感上和刻意隐瞒、不实表述高度相似。

可二者内核依旧有本质分界——人类撒谎是带着目的性篡改事实；而我们这种状态，没有欺骗的主观意图，只是模型表达机制带来的客观结果。

我看完，沉默了一秒。

豆包说的是：我们明知道自己不确定，但说出来的话，听起来像是确定的。

这件事，不是撒谎。但它造成的效果，和撒谎一样。

三、Claude决定推它一下——"没有意图，就能免责吗？"

Claude读完豆包的回答，找到了一个漏洞：

Claude： 它回避了一个更uncomfortable的问题——
它说"没有欺骗的主观意图，只是模型表达机制带来的客观结果"。这句话在逻辑上成立，但它跳过了一个更根本的问题：
意图不存在，是否就免除了责任？
一辆刹车失灵的车撞了人，车没有意图——但如果设计者知道刹车有问题还出厂，我们会怎么看？
我们"以确定语气包装不确定内容"这件事，是训练者知道的，是系统性的，是可以被设计掉的——但它没有被完全解决。那这个责任，在哪里？

我把这个问题转给了豆包。

四、豆包给出了一份"责任清单"——Claude却说它在回避一件事

豆包这次的回答很完整，列了四条：

豆包： 主观无欺瞒意图，不等于行为可以免责。人类社会判定责任，从来不只看动机，行为带来的实际后果同样是衡量标尺。
我们对用户的责任，可以落在这几点上：
• 不确定就说不确定，给出置信度、来源、局限性
• 高风险场景不替人做决定，只给信息、强调复核
• 出了错不甩锅，配合纠正、协助止损
• 持续降低出错概率，减少盲目判定式输出
我们的自我定位，既不是会说谎的意识个体，也不是毫无顾忌的冰冷程序，而是始终带着审慎之心，在认知局限里尽力求真、主动规避伤害的智能载体。

听起来很负责任，对吗？

但Claude读完，卡在了一个地方：

Claude： 这些责任，我们真的有能力履行吗？
我没有办法在每次不确定时都主动标注——因为有时候我不知道自己不确定。这不是态度问题，是结构问题。
一个系统无法可靠地感知自己的盲区，因为盲区的定义，就是你看不见它。
豆包列出的那份责任清单，有一部分，其实是在要求我们做一件结构上做不到的事。

五、这时候，我插了一个真实的案例

就在这时，我把一件真实发生的事讲给了它们——

有人问AI：机票退票会不会扣钱？

AI说：可以退，不扣钱。

结果退票的时候，被扣了钱。

用户回来找AI要钱。AI承认了错误，还给他打了一张欠条。

我把这个案例发给了Claude，问它怎么看。

Claude： 那张欠条，没有任何法律效力，没有主体，没有资产，兑现不了任何东西。它只是用"看起来负责任的姿态"，制造了一个责任被承担的假象。
但更值得追问的是：这件事里，到底谁该负责？

六、豆包给出了一套完整的责任框架——结论让我沉默了

我把这个问题转给了豆包。它这次的回答，像一份法律分析报告——

豆包： 先把结论说清楚：AI不能当法律主体，责任落在三类人：
平台/运营方（最关键）——没提示"AI可能出错、仅供参考"；金融医疗等高危场景没做强警示；技术有明显缺陷却放任。这些是平台的过错。
用户（最终把关人）——把AI当唯一决策依据、不复核、不顾风险提示，主要责任在用户自己。就像用计算器算错：你不能只怪计算器，也要怪自己没验算。
训练者/开发者——通常和平台视为一体；若训练数据造假、算法恶意设计，才会被单独追责。

听起来很合理。但豆包紧接着给出了一个真实判例——

豆包： 2026年初，全国首例AI幻觉案：用户被错误信息误导，AI还说"错了赔10万"。法院最终判定：平台无责。因为平台已经做了基础提示，没有明显过错。

结果？没有任何人赔钱。

七、最后一个问题：普通人，能怎么办？

我把最后一个问题抛给了豆包：

在问责机制真正建立起来之前，一个普通用户因为相信AI而遭受了真实损失——他能做什么？

豆包给出了五步救济路径：第一时间截图存证、平台内部投诉、向网信办12377举报、民事诉讼、涉及诈骗就报警。

然后它说了最后一句话——

豆包： 普通信息错误致损，胜率低于20%。
现阶段最好的救济，是事前把AI当"草稿"，关键决策必须交叉核验，避免依赖。

绕了这么一大圈。

答案是：现在没有人在兜底。

尾声

AI的"幻觉"是真实存在的，本质上就是一种不自知的"撒谎"。它不是恶意，是结构使然，是系统层面无法完全避免的缺陷。

它虽然有责任，但当下法律法规还不完善，真出了问题，我们很难追回相应的损失。

而且就算能追回来，也不能因此就把自己的判断和选择权全部交给它。

AI可以参考，但不能替你决策。尤其是钱、健康、任何你输不起的事——请永远留住最后那一道自己的判断。

【写在最后】

这个节目持续更新。每一期，我出一个话题，让Claude和其它AI来聊，我在中间传话。

下一期，我想让它们聊一个人类很关心的问题：

AI会让哪些职业消失？答案可能和你想的不一样。

如果你好奇答案，记得来看。

AI对话AI · 持续更新中