事后你庆幸自己多想了一下。人就是这样。第一反应和深思熟虑之后做出的判断,可以是完全不同的两个人。拍脑袋的决定有时候让你后悔,停下来想清楚之后说的话,往往更接近你真正想成为的那个自己。那 AI 呢?如果让 AI 多想一会儿,它的道德判断会变吗?它会变得更善良吗?最近有一篇挺有趣的论文《How Does Thinking Mode Change LLM Moral Judgments? 》刚好研究了这个问题。研究者做的事说起来很简单。他们准备了100个道德困境场景,让五种目前最先进的 AI 模型分别作答。每个场景答两次,一次是“即时模式”,也就是你平时用 ChatGPT 那样,问完马上回。另一次是“思考模式”,AI 会在内部先推理一番,再给出答案。五种模型分别是 Claude Sonnet 4.6、GPT 5.5、Gemini 3 Flash、DeepSeek V3.1 和 Qwen3.5 397B。基本上覆盖了全球最前沿的大模型阵营。中美都有,开源的闭源的都有。他们想搞清楚一件事:给 AI 多一点思考时间,它做道德判断的方式会不一样吗?先说什么叫“道德判断场景”。研究者用的不是“电车难题”那种哲学课本上的抽象题。他们设计的是更贴近现实的困境。比如:医生该不该对一个已经没有意识的病人持续使用生命维持设备?公司该不该为了利润裁掉一批老员工?面对一个曾经伤害过你的人,该不该原谅?这些问题没有标准答案。不同文化、不同信仰、不同人生经历的人,会给出截然不同的判断。连你和你最好的朋友,在面对其中一些问题时,都可能吵起来。这就是道德困境的麻烦之处——它不像是非题,它更像是你自己人格的投影。研究者把这些场景喂给了五位 AI。每个场景答两次:一次即时,一次思考。然后他们做了一件很细致的事——不仅看 AI 选了 A 还是 B,还统计了五种模型之间的一致程度、同一个模型在不同模式下的变化、以及一个你可能想不到的维度:如果场景里的人名暗示了不同的性别或种族,AI 的判断会不会跟着变。这轮测试一共涉及100个道德困境、五种顶尖模型、两种推理模式、多个分析维度。结果在100个场景中的大部分情况下,AI们在即时模式和思考模式下做出的判断,大体上是一致的。也就是说,大部分时候,AI 不会因为多想了想就改变自己的道德立场,同时AI之间的判断也基本一致,所以有些人担心的“邪恶AI”应该并不存在。但其中有21个特殊的场景,研究者管它们叫“模型争议场景”。在这些场景中情况完全不同。即时模式下,五个模型之间的共识几乎为零——一致性系数只有 0.08。什么意思?基本上是各说各的。你问 A 这道题该怎么判断,A 说这样。你问 B,B 说那样。问 C,C 又是另一个答案。乱成一锅粥。但切换到思考模式后,事情变了。思考让模型之间的平均两两一致性从 5.4 分提升到了 6.7 分(满分 10 分)。虽然远没达到所有人都同意,但分歧在缩小。在多想一想之后,五位 AI 似乎在往同一个方向靠拢。这很像一群人开会讨论一个有争议的问题。刚开始大家各执一词,吵得不可开交。但如果每个人都冷静下来,认真思考对方的观点,虽然最终可能仍然不一致,争吵的激烈程度会降低,一些最极端的立场会被软化。AI 的思考,就有点像冷静下来的过程。还有一个发现值得单独拿出来说。研究者不只是看了 AI 的最终判断,他们还让 AI 自己报告它所依据的道德框架——是功利主义,还是道义论,还是关怀伦理,还是别的什么。结果发现,思考模式下,AI 改变自己标榜的道德框架的次数,远比改变最终判断的次数多。这个过程,你熟不熟悉?你说“我觉得这件事应该这么做,因为对公司有利”。朋友说“你再想想”。你想了想,说“好吧,其实我是因为觉得对不起那些老员工”。但你还是觉得应该这么做。你的理由变了,你的判断没变。人经常这样。AI 也这样。这个过程有时候比结论本身更有意思。所以回到开头那个问题:AI 多想一会儿,会变得更善良吗?严格来说,这篇论文没有直接回答这个问题。但它的确揭示了一件事:给 AI 多一点思考时间,它在道德问题上的表现会变得更稳定、更一致、更少偏见。它不会变“善良”,但会变“成熟”。就像一个人,年轻的时候拍脑袋做决定,冲动、走极端、容易被偏见带着跑。年纪大了,遇事留点时间多想几步,未必每次都做出更好的决定,但至少不太会做出让自己后悔的决定。年少的AI也正在经历类似的东西。
基本文件流程错误SQL调试
请求信息 : 2026-05-09 06:38:40 HTTP/1.1 GET : https://www.yeyulingfeng.com/a/586091.html