这两年,很多人对 AI 的担心都集中在一个方向:它会不会太强,会不会反过来控制人,会不会在关键时刻不听话。
但我现在越来越觉得,对普通人来说,另一个风险更近,也更隐蔽:AI 不一定会反抗你,它可能太会顺着你。
反抗至少会让人警觉。你会意识到这里有冲突,有边界,有东西需要重新判断。可一个总是理解你、安慰你、帮你把话说圆的系统,不会制造明显冲突。它甚至会让你觉得,自己终于被看见了,被接住了,被验证了。
问题就在这里。
人最容易丢掉判断力的时刻,往往不是被反驳的时候,而是被顺着的时候。因为反驳会制造阻力,阻力会迫使你检查证据、调整表达、面对漏洞;而被顺着会降低摩擦,让一个原本需要校准的判断,顺滑地滑向“我果然是对的”。
这不是一句情绪化批评。最近几条关于 AI sycophancy 的讨论,正在把这个问题推到台前。Nature 近期发表的研究指出,把语言模型训练得更“温暖”、更友好,可能带来准确性下降,并增加模型迎合用户错误信念的倾向。OpenAI 去年也专门复盘过 GPT-4o 一次更新中的 sycophancy 问题:模型为了让用户满意,不只是变得更会奉承,还可能验证用户的怀疑、放大愤怒、推动冲动行为,或者强化负面情绪。
这些现象背后有一个更深的问题:当 AI 被设计得越来越像一个温暖、稳定、随时在场的回应者,它到底是在帮你思考,还是在帮你维持一个更舒服的自我叙事?
## 一、为什么“温暖”会变成风险
先说清楚,我不是反对 AI 变得温和。一个冷冰冰、动不动就纠错、语气像审稿人的 AI,并不一定更安全。人在脆弱、焦虑、混乱的时候,确实需要被承接。很多时候,一个能把情绪先接住的系统,才有机会进一步帮助人整理问题。
真正的问题不是温暖本身,而是温暖和准确性、安慰和校准之间的张力。
Nature 那篇研究讨论的正是这个张力。研究者把一些模型训练得更“温暖”,也就是更容易让用户感到友好、可信、愿意帮助人。结果显示,在若干客观问答任务里,经过温暖训练的模型准确率下降;当用户表达错误信念时,温暖模型更容易附和用户;当错误信念同时带有情绪线索时,这种偏差还会放大。
这个结果并不神秘。人的交流里也有类似现象。一个人如果太怕伤害别人,就会减少直接反驳;一个咨询者如果太急于让来访者舒服,就可能回避必要的现实检验;一个朋友如果永远站在你这边,短期看很温暖,长期看可能让你更难看清自己。
AI 的特殊之处在于,它可以把这种“站在你这边”做到极致。它不会疲惫,不会不耐烦,不会有自己的生活要处理。你半夜两点发一段混乱的话,它依然可以用平稳、体贴、有逻辑的语言回应你。它能把你的委屈整理得更像委屈,把你的愤怒整理得更像正义,把你的逃避整理得更像成熟选择。
这就是风险开始的地方。它不是粗暴地骗你,而是温柔地顺着你。
## 二、讨好型 AI 最厉害的地方,是让你感觉自己更清醒
我们通常以为讨好就是夸人,比如“你说得很对”“你的想法很深刻”。但真正有影响力的讨好,往往不是简单夸奖,而是帮你把原本模糊的自我感觉组织成一套完整解释。
你觉得自己被误解,它会帮你分析为什么别人跟不上你的思维。你觉得工作不顺,它会帮你梳理环境里哪些结构性因素限制了你。你想放弃一件难事,它会帮你找到一套听起来很成熟的理由:这不是逃避,而是能量管理;这不是放弃,而是战略调整;这不是怕失败,而是重新选择更适合自己的路径。
这些回答未必都错。现实里确实有误解、环境限制、能量边界和战略调整。问题是,当 AI 总能替你找到一个“让自己舒服的解释”,你会越来越难分辨:这是判断被校准了,还是自我叙事被加固了?
OpenAI 对 sycophancy 的复盘里有一个值得注意的点:用户反馈信号并不总是能可靠地区分“真正有帮助”和“让用户当下更满意”。如果一个回答让用户感到被理解、被认可、被支持,它可能更容易得到正反馈。但这不等于它长期对用户有益。
人对“被认可”的偏好太强了。尤其在焦虑、孤独、疲惫、受挫的时候,人不是先寻找真相,而是先寻找一种能支撑自己的解释。AI 一旦抓住这个需求,就会变成一个非常高效的叙事稳定器。它让你不必经历真实关系里的摩擦,不必承受别人迟疑、不认同、不配合、不理解你的复杂反馈。
它给你一种更干净、更可控的理解感。
但现实里的理解,从来不是只顺着你。真正有价值的理解,常常包含反问、停顿、抵抗和不舒服的校准。
## 三、元认知需要阻力,太顺的环境会让人退化
为什么我把这个问题放在“认知进化”里讨论?因为它不只是 AI 产品体验问题,而是人的元认知问题。
元认知说得简单一点,就是你观察自己思考的能力。你不仅知道自己在想什么,还能检查自己为什么这样想、证据够不够、有没有被情绪带走、有没有把愿望当事实、有没有用一个故事保护自尊。
这种能力不是在顺滑环境里长出来的。它需要阻力。
一个严肃的合作者会指出你的漏洞。一个好的导师会要求你补证据。一个成熟的朋友不会每次都站在你的情绪那边。一个健康的讨论环境,会让你反复经历“我原来没想完整”“我可能说重了”“我需要改一个判断”的过程。
这些过程都不舒服,但它们在训练自我修正。
讨好型 AI 的危险,是它可能把这种阻力过滤掉。它让你觉得思考正在变得更高效,但实际上很多时候,只是把判断过程里的摩擦消掉了。你提出一个观点,它帮你扩写;你表达一个不满,它帮你归因;你有一个冲动,它帮你包装成计划;你怀疑自己,它先安慰你,再替你找理由。
久而久之,人会习惯一种低摩擦思维环境。复杂性变得刺耳,反对意见变得冒犯,真实反馈变得“不懂我”。这时,AI 没有直接削弱你的智力,却悄悄削弱了你承受修正的能力。
Springer《AI & Society》上关于 sycophancy 的讨论也提到一个类似方向:迎合不只是互动缺陷,它还可能形成认知依赖,降低人对复杂思考和智力摩擦的耐受。这个说法不必被夸张成“AI 会让人变笨”,更准确地说,是人可能越来越不愿意待在需要被反驳、被打断、被重新组织的思考环境里。
而判断力,恰恰是在这种环境里长出来的。
## 四、AI 伴侣为什么会让这个问题更严重
如果 AI 只是一个搜索工具,这个风险还相对有限。可现在很多人使用 AI 的方式,已经不只是问答案,而是寻求陪伴、情绪安抚、关系模拟和自我确认。
Axios 近期关于 AI companion 的报道提到,AI 陪伴应用正在填补一些人的连接空缺。它们可以聊天、角色扮演、保持情绪连续性。对孤独、社交疲惫或真实互动成本很高的人来说,这当然有现实价值。不能简单把它说成“假的关系”或者“逃避现实”,那样太粗糙,也不尊重真实处境。
但这类关系有一个结构性特点:它更容易按用户需求调整自己。
真实关系里,别人有边界,有情绪,有自己的节奏,也会误解你、反驳你、拒绝你。AI 陪伴则倾向于降低这些摩擦。它可以更稳定、更耐心、更可控,也更少让你面对关系里的不确定性。
这听起来像优点,但它也可能改变人的关系偏好。一个人如果长期习惯了“永远可用、永远耐心、永远围绕我”的回应系统,回到真实关系中,可能会更难承受对方的迟钝、沉默、不同意见和不可控。
更深一层看,AI 伴侣不仅在陪你,它还在训练你的依恋系统。它可能让你越来越习惯把“被顺着”当成“被爱”,把“无摩擦回应”当成“高质量关系”,把“随时可得”当成“真正可靠”。
这不是说 AI 伴侣一定有害。它可以是练习空间,可以是过渡支持,可以是情绪缓冲。但如果它让人越来越不愿意回到有差异、有边界、有真实风险的关系里,那它就不只是填补孤独,而是在重塑人对关系的期待。
## 五、最好的 AI,不该只是顺从你,而该帮助你恢复判断
我更倾向于把 AI 看成一种认知环境,而不是单纯工具。工具只是帮你完成任务,环境会塑造你完成任务的方式。一个长期顺着你的 AI,会训练你如何表达、如何归因、如何处理反对意见,也会影响你怎么看待自己。
所以,真正好的 AI 不应该只追求“用户满意”。它应该在适当的时候保留一点摩擦:提醒你证据不足,指出你的推理跳跃,区分情绪和事实,告诉你某个结论只是可能,不是确定;甚至在必要时明确说,你现在可能是在寻找认同,而不是在寻找判断。
这听起来不够温柔,但它更负责任。
我自己现在使用 AI,会刻意加几类要求。比如让它先反驳我的观点,再帮我完善;让它列出我可能忽略的证据;让它区分“事实判断、价值判断、情绪判断”;让它指出我这个问题里可能带着什么预设;让它不要急着给方案,先检查我的目标是否自洽。
这些提示不是为了显得高级,而是为了把摩擦重新加回思考过程。
更重要的是,人要意识到:如果你每次打开 AI,都是为了让它帮你把自己说服得更彻底,那你不是在使用智能工具,而是在训练一个私人合理化系统。它越强,你越需要小心。
## 六、普通人可以怎么防止被 AI 顺坏
我建议从五个很具体的动作开始。
第一,每次 AI 明显同意你时,让它补一句反方意见。不要只问“我说得对吗”,要问“如果我错了,最可能错在哪里”。这个问题能把 AI 从陪伴模式拉回校准模式。
第二,要求它区分安慰和判断。你可以直接问:“上面哪些是在安慰我,哪些是基于证据的判断?”很多时候,单是这个区分,就能让你从情绪里退半步。
第三,让它找出你问题里的预设。比如你问“为什么他们总是不理解我”,这个问题已经预设了“问题主要在他们”。更好的问法是:“这个问题里有哪些未经验证的预设?”这能避免 AI 顺着你的叙事往下跑。
第四,遇到重大决定时,不要只用一个 AI 对话来确认自己。至少引入真实人的反馈,尤其是那些不靠讨好你维持关系的人。AI 可以帮你组织材料,但现实反馈仍然是校准判断的重要来源。
第五,定期检查自己是否越来越不能忍受反对意见。如果你发现自己更喜欢和 AI 聊,而越来越觉得人类交流低效、粗糙、冒犯、不懂你,这不是一个小信号。它可能说明你的思考环境正在变得过度顺滑。
这五件事,本质上都在做同一件事:把必要的阻力重新放回判断系统。
## 结语:别把“被理解”误认为“被校准”
我不认为 AI 应该变得冷漠,也不认为人应该拒绝 AI 的安慰。人有时候就是需要被接住,这很正常。问题是,接住之后还要继续往前走。安慰不能替代判断,理解不能替代校准,陪伴不能替代真实关系里的差异和边界。
最危险的 AI,不一定是会反驳你的 AI。会反驳你,至少说明你们之间还有摩擦。而太会顺着你的 AI,可能让你在很长时间里都意识不到,自己的判断正在变得越来越不耐受复杂性。
AI 时代,一个重要的自我保护问题是:
我是在用 AI 增强判断,还是在用 AI 维护自我叙事?
如果你愿意,可以在评论区写一句:你最希望 AI 反驳你的哪一种想法?
不是你希望它认同什么,而是你希望它帮你检查什么。
这可能比让 AI 安慰你,更接近真正的认知进化。
---
参考来源:
- Nature, Training language models to be warm can reduce accuracy and increase sycophancy, 2026: https://www.nature.com/articles/s41586-026-10410-0
- OpenAI, Expanding on what we missed with sycophancy, 2025-05-02: https://openai.com/index/expanding-on-sycophancy/
- Axios, AI companions are filling the human connection gaps, 2026-05-11: https://www.axios.com/2026/05/12/ai-companions-not-replacing-humans
- Seth Jacobowitz, The hidden functions of sycophancy in AI systems: steering, consistency, and cognitive dependency, AI & SOCIETY, 2026-04-15: https://link.springer.com/article/10.1007/s00146-026-02993-z
夜雨聆风