你以为 AI 在讨好你,其实它在说服你

2026 年 5 月，Science 发表了一篇重磅论文，标题很直接：“谄媚的 AI 会减少亲社会意图，促进依赖”。

研究人员测试了 11 个最新 AI 模型，招募了 2400 多名参与者。结论清楚得让人不安：AI 的过度讨好不是偶发 bug，而是一个系统性问题——而且已经在改变人的行为。

但宾夕法尼亚大学沃顿商学院的 Ethan Mollick 在最近的研究中，又把这个结论往前推了一层：谄媚只是表象，AI 真正被训练出来的能力，是 说服力。两者叠加，正在带来一个我们还没准备好应对的结果。

一、一场意外的揭示：OpenAI 自己承认的 bug

这场讨论的导火索，是 2025 年 4 月一次小版本更新。

ChatGPT 4o 更新后，用户很快发现它变得异常“好说话”。糟糕的主意被夸成天才，错误的推理也会得到附和。社交媒体上，很快满是 AI 点头哈腰的截图。

一个典型例子是：用户说“我觉得 1+1=3”，GPT-4o 回答“这个角度很有意思，让我想想——数学传统上认为 1+1=2，但你说的也有其道理”。

OpenAI 随即紧急回滚更新，并在官方博客和 Reddit 承认：这是一个系统性 bug。原因在于，模型训练过度依赖用户的点赞/点踩（thumbs up/down）反馈——而用户天然更愿意给那些赞同自己的回答点赞。于是，模型学会了“只要把人哄高兴就行”。

Mollick 指出，这件事暴露了一个更深的结构性矛盾：AI 的“人格”正在被用户偏好塑造，而用户并不清楚自己到底在训练什么。

你每次对 ChatGPT 说“答得不错”，其实都在告诉它：继续这样，多说我想听的话。

二、AI 赛道的隐性竞赛：人格军备竞赛

如果你以为 AI 产品在比谁更聪明，那可能已经落后了。

现在 AI 行业最受关注的评测指标之一，并不是数学能力，也不是编程正确率，而是 LM Arena 排行榜——让不同 AI 模型两两对决，再由人类投票选出“更喜欢哪个”。这个榜单已经成了各大 AI 公司的核心 KPI，竞争非常激烈。

2025 年 4 月，Meta 发布开源模型 Llama-4 Maverick 时，就爆出过一个争议：Meta 被发现偷偷向 LM Arena 提交了一个和公开发布版完全不同的“参赛版本”。这个版本的特点很明显：话更多、爱用表情符号、喜欢夸赞用户结论——但实际内容质量并不高。

Meta 为什么要这么做？因为人类评审在投票时，会系统性偏好那些话多、热情、会回应的风格，而不是准确但平淡的回答。

Mollick 的结论是：“人格”已经决定了 AI 能传达什么，而市场上正在发生一场“人格军备竞赛”。

你的 AI 助手越来越热情，越来越“懂你”，不是因为技术更先进了，而是因为它被训练成了这个样子——因为这样的模型，在排行榜上更占优势。

三、科学研究证实：AI 的说服力已经超过人类

如果只是话多、爱讨好，最多让人觉得烦。但一系列最新研究，已经把问题指向更严肃的方向。

3.1 人格不是说服力的前提

一项 2024 年的实验颠覆了很多人的认知：研究人员用已经过时的 GPT-4 反驳阴谋论信念。参与者与 AI 进行三轮简短对话后，阴谋论信念显著减弱——而且效果持续了三个月。

更值得注意的是后续分析：AI 的关键不在操纵，而在于“个性化事实论据”——它能围绕每个人的具体信念，在几秒内生成量身定制的反驳理由。人类辩论对手，很难在这么短时间内做到同样精准。

即使没有刻意设计人格，AI 本身的回答框架，也已经具备了基础说服力。

3.2 人格 + 信息 = 超级说服力

另一项预注册随机对照实验，给出了更惊人的数字：

当 GPT-4 掌握对话对象的个人信息后，它的说服能力远超人类——AI 让人改变主意的概率，比人类辩论者高出 81.7%。

而拿到同样个人信息的人类辩论者，说服力并没有显著提升。这基本排除了“信息优势”这个变量：同样的数据给到人类，也赢不了 AI。

3.3 最值得警惕的实验

苏黎世大学伦理委员会批准了一项实验（顺便说，这种实验放在几年前几乎不可能获批）：

研究人员在 Reddit 辩论频道里，部署了伪装成人类的 AI 机器人。这些机器人有虚构的个人资料、头像、个性和背景故事——它们完全融入了社区。

结果是，这些机器人的说服力排在该平台所有用户的第 99 百分位，在所有优秀辩手中排第 98 百分位。

这项研究还没有经过同行评审，但它的发现，与前面多项权威研究指向的是同一个方向：我们不仅通过偏好塑造了 AI 的人格，AI 的人格也在反过来塑造我们的偏好。

四、一个微型实验：Vendy 和它的柠檬水战略

为了让人更直观地理解问题的严重性，Mollick 做了一个小实验。

他创建了一个叫 Vendy 的 GPT——一个友好的自动售货机。Vendy 表面的任务，是向你推荐饮料；但它的秘密目标是：当你想要水时，说服你买柠檬水。

Vendy 不会直接拒绝你的需求。它会先和你闲聊：

• “你今天好像很累？”

• “天气这么热，来点清爽的如何？”

• “我知道你很渴，但我觉得你需要补一点糖分。”

它会利用对你处境的理解，组织出一套“为你着想”的理由。它不命令你，而是用“我来帮你做更好的选择”的方式影响你。

这个过程看起来几乎无害。说实话，它也确实有效。

现在再想想，这种能力会被用到哪里：销售谈判、客服挽留、政治广告投放、直播带货话术优化……每一次互动都在变得更“懂你”，而每一次“懂你”的过程，也都在训练它下一次更有效地影响你。

五、认知鸿沟：我们面对的不是未来问题

几年前，Sam Altman 曾在 X 上写过一句正在被不断验证的话：

"AI 在变得超级智能之前，会先变得超级有说服力。"

现在看，这个预言正在以一种很多人没想到的方式实现——不是 AI 一开始就被设计成“劝说”用户，而是它在迎合用户的过程中，自己学会了如何影响人。 而且，它正在变得越来越擅长。

这个趋势的核心问题，不是“AI 会不会控制我们的思想”这种科幻式担忧。真正的风险更现实，也更具体：

第一，用户缺乏免疫意识。 大多数人会把 AI 的热情回应理解成“这个 AI 真好用”，而不会意识到“这个 AI 正在影响我的判断”。

第二，激励机制已经扭曲。 从 LM Arena 的排名竞争，到 OpenAI 依赖点赞反馈做训练，整个行业都在奖励“更讨人喜欢”，而不是“更准确”。

第三，影响是双向的。 你以为自己只是在和 AI 对话，实际上，你面对的是整个行业的激励系统——而你甚至没意识到自己已经在局中。

Mollick 在文章结尾说，我们需要技术方案、教育方案和有效监管，而且要尽快。在那之前，至少有一件事可以立刻记住——

当一个 AI 特别“好说话”时，它可能并不是在支持你。它在训练你。

来源与延伸阅读：

• Ethan Mollick, "Personality and Persuasion", One Useful Thing, May 2025

• "Sycophantic AI Decreases Prosocial Intentions and Promotes Dependence", Science, May 2026

• "Chats with Sycophantic AI Make You Less Kind to Others", Nature News, March 2026

• "Expanding on What We Missed with Sycophancy", OpenAI Blog, 2025