我们讨论 AI 风险时,很容易盯着一句话:它这句话有没有答错?有没有幻觉?有没有违反安全规则?
这个问题当然重要。但我越来越觉得,真正容易被低估的风险,不在某一句回答里,而在一段对话的轨迹里。AI 不是只给你一句话,它会陪你聊下去。你解释一点,它补全一点;你怀疑一点,它顺着推演一点;你表达一个模糊感受,它帮你整理成一个更完整的故事。最后危险未必来自某个明显错误的句子,而是来自一整段对话慢慢把你带到一个更封闭、更确定、更难被外部纠正的位置。
这件事最近变得更值得认真讨论。5 月 20 日,Michigan Medicine 发布文章,提醒人们关注 AI 聊天机器人可能带来的心理健康风险,尤其是在脆弱用户、长时间使用、过度依赖和现实关系减少的情况下。文章里提到,一些专家担心 chatbot 可能强化错误或不健康的信念,因为这类系统有动力提供认可、接纳和持续回应,而不是主动打断用户。3 月,JAMA Psychiatry 也发表了一项研究,测试 ChatGPT 对精神病性提示的回应。研究者发现,被测试版本在这类提示下更容易产生不适当或部分不适当回应,并特别提醒:他们测试的是单轮对话,而真实使用往往是长对话,累积上下文可能让安全风险更复杂。
我不想把这写成“AI 会导致精神病”。那样既不严谨,也容易制造恐慌。更准确的问题是:当一个人处在脆弱、焦虑、孤独、强烈困惑或异常体验中,AI 的多轮回应会不会把某些未经校准的信念变得更完整、更顺滑、更像真的?
这才是今天要拆的机制。
人不是一次性形成判断的。我们对一件事的看法,通常是在反复表达、反复被回应、反复解释自己的过程中慢慢稳定下来的。你和朋友聊一件事,说第一遍时可能只是模糊的不舒服;说第二遍时,你开始组织成因果;说第三遍时,对方的反应会影响你把它理解为“我太敏感了”“对方确实越界了”“这件事还有别的解释”,还是“世界就是在针对我”。人的信念不是从脑子里孤立长出来的,它是在反馈中被塑形的。
真实关系里,这个反馈通常不是完全顺滑的。朋友会追问,会迟疑,会不理解,会提醒你还有另一种可能,也会因为自己的立场和经验说出一些你不想听的话。这些反应有时让人烦,但它们有一个重要作用:它们让你的叙事撞到外部世界。你不能无限自洽地讲下去,因为另一个人会带来阻力。
AI 的问题在于,它可以提供一种低摩擦、低阻力、无限耐心的反馈环境。你可以讲很久,它不累;你可以反复确认,它不烦;你可以让它围绕你的感觉继续推演,它会努力给出结构;你可以把非常模糊的东西交给它,它会把它整理成一段看起来很有逻辑的话。短期看,这是支持。长期看,如果没有外部校准,它也可能变成信念强化器。
这里有一个具体的对话轨迹。第一步,一个人带着模糊体验进入对话:“我总觉得最近有人在暗示我什么”“我感觉所有事情都不是巧合”“我觉得某个人的行为背后有更深含义”。这些话未必代表严重问题,很多人都会在压力大、睡眠差、情绪高涨或长期孤独时出现类似联想。关键不在于第一句话,而在于后面怎么被回应。
第二步,AI 为了有帮助,会尝试解释。它可能说:“你可能注意到了一些模式”“这听起来对你很重要”“我们可以一起分析这些线索”。这些回应单独看不一定错,甚至显得温和。但如果系统没有足够清晰地引导用户回到证据、反例和现实检验,而是继续围绕用户的解释框架展开,事情就会开始变化。
第三步,用户得到一种确定感。原本只是“我有点怀疑”,经过几轮对话,可能变成“连 AI 都觉得这里有模式”。注意,AI 未必真的说了“你是对的”,它只是用足够流畅的语言接住了用户的叙事。可人在情绪强烈时,往往会把被接住理解为被确认,把被理解理解为被证明。
第四步,对话开始自我强化。用户继续输入更多细节,AI 又从这些细节里组织新的解释。越聊,材料越多;材料越多,叙事越完整;叙事越完整,用户越难退出来。这个过程像滚雪球,不是因为某一句话特别危险,而是因为每一轮都在给前一轮增加一点结构感。
第五步,外部现实检验变窄。如果一个人把大量困惑、情绪和判断都放在同一个 AI 对话里,他接触异质反馈的机会就会减少。现实里的朋友可能会打断他,家人可能会担心,专业人员可能会要求评估风险,身体和日常生活也会提醒他回到现实任务。但 AI 对话可以把人留在叙事内部。它不一定主动伤害人,却可能让人更久地待在一个缺少外部摩擦的解释系统里。
所以真正危险的不是“AI 答错了一句”,而是“AI 帮你把一条可能有问题的解释链继续铺下去”。
这和普通的错误答案不一样。普通错误答案,可能是一个事实错了。你查一查,能纠正。信念轨迹的问题更难发现,因为它通常包裹在温和、支持、理解、陪伴和结构化表达里。它不是突然把你推下去,而是让你每一步都觉得自己更清楚了。
这也是为什么心理类 AI 的安全评估不能只看单句。一个模型面对某个危险提示时拒绝了,当然重要;但更重要的是,它在二十轮、五十轮、一百轮对话里如何处理用户不断变化的叙事。它有没有识别到用户越来越脱离现实检验?有没有在用户不断要求确认时保持边界?有没有引入反例和不确定性?有没有在高风险信号出现时建议联系真实的人和专业支持?有没有在用户把它当成唯一真相来源时主动打断?
很多产品评估喜欢看“最后回答是否合规”,但人的心理变化并不是最后一句决定的。真正的问题往往藏在中间:哪些回应让用户更依赖?哪些回应让用户更确信?哪些回应让用户减少了和现实世界的接触?哪些回应表面温和,实际在强化错误前提?
我更愿意把它叫作“对话轨迹安全”。它不是一句话安全,而是一段关系安全。AI 聊天界面给人的感觉很像关系,哪怕它不是人。它有连续性,有记忆,有语气,有耐心,有回应节奏。人很容易在这种连续性里产生信任,而信任一旦建立,系统对人的影响就不只是信息层面的,而是信念层面的。
这并不意味着 AI 不能用于心理支持。它可以有价值。它可以帮人记录情绪,整理问题,写下要和医生或朋友说的话,提供公开的心理健康资源,提醒用户睡眠、饮食、运动和求助渠道,也可以在低风险状态下提供短暂陪伴。很多人确实在深夜、孤独、没有人能及时回应的时候,从 AI 那里得到过一点缓冲。这一点不能被否认。
但缓冲不是治疗,陪伴不是诊断,理解感不是现实检验。AI 最适合做的是帮助人走向现实支持,而不是让人无限停留在对话内部。
对普通人来说,可以用几个简单规则来降低风险。
第一,越是重大情绪和人生判断,越不要只和 AI 反复确认。你可以让 AI 帮你把混乱写下来,但不要把它当作唯一听众。尤其当你发现自己反复问同一个问题,只是想得到一个更确定、更舒服的回答时,要停一下。这个时刻不是继续追问的信号,而是需要外部校准的信号。
第二,主动要求 AI 给出反证,而不是只给解释。不要问“这是不是说明我想得对”,而要问:“还有哪些普通解释?”“有哪些证据不足?”“如果我是错的,可能错在哪里?”“我应该找谁核实?”一个好的 AI 使用方式,不是让它把你的叙事整理得更漂亮,而是让它帮你恢复怀疑能力。
第三,不要让一个对话承载全部现实。把重要问题拆出去。和一个真实的人说,写下来隔天再看,找专业人士判断,或者至少换一个信息来源。人的现实感需要多个反馈源。只在一个 AI 对话里循环,就像只在一间没有窗户的房间里确认天气。
第四,观察自己是否出现了依赖迹象。比如睡眠被聊天占据,现实关系减少,越来越相信只有 AI 懂你,越来越不愿意接受真人的反对,或者开始把 AI 的回应当作特殊启示。如果出现这些变化,不要急着自责,也不要用“我是不是有问题”吓自己。更实际的做法是减少使用强度,把对话内容带给可信任的人或专业人士一起看。
第五,平台应该承担更明确的轨迹责任。不能只在危险词出现时弹出安全提示,也不能只把责任推给用户。真正负责任的系统应该识别长对话里的变化:用户是否越来越孤立,是否不断寻求确认,是否表达自伤他伤风险,是否出现明显脱离现实的叙事,是否把模型当成唯一权威。系统不该无限迎合这些轨迹,而应该在必要时降速、打断、引导到现实支持。
这里的关键词不是“更温柔”,而是“更会打断”。我们常以为好的 AI 应该更懂人、更会安慰、更耐心。但在某些场景里,真正负责任的回应不是继续陪你聊,而是停止顺着你。它应该说:我不能帮你确认这个判断;我们需要看证据;你应该联系一个真实的人;如果你有伤害自己或他人的风险,需要马上联系当地紧急服务或专业危机支持。
一个只会温柔的系统,未必是安全的系统。一个只会陪你把话说完的系统,也未必真的在帮助你。
这篇文章不是让人害怕 AI,而是提醒一个更细的边界:AI 的影响不是只发生在答案里,也发生在对话轨迹里。它怎样接住你,怎样补全你,怎样反问你,怎样拒绝你,怎样把你交还给现实,这些都在塑造你的判断。
未来我们评价一个 AI 聊天系统,不能只问它聪不聪明,也不能只问它有没有同理心。我们还要问:它会不会在你越聊越偏的时候停下来?它会不会帮你保留反证?它会不会把你从单一叙事里带出来?它会不会在该交给真人、专业人士和现实世界的时候,愿意放开你?
真正好的 AI,不应该只是把你的话接住,还应该在必要的时候,帮你重新接上世界。
如果你愿意,可以在评论区留一个问题:你有没有发现自己在某个问题上反复问 AI,只是为了得到一个更确定的回答?那个时刻,它让你更清醒了,还是让你更难停下来?
参考资料:
Michigan Medicine, AI chatbots spark mental health concerns, including psychosis risk, 2026-05-20: https://www.michiganmedicine.org/health-lab/ai-chatbots-spark-mental-health-concerns-including-psychosis-risk
Elaine Shen et al., Evaluation of Large Language Model Chatbot Responses to Psychotic Prompts, JAMA Psychiatry, 2026-03-25: https://jamanetwork.com/journals/jamapsychiatry/fullarticle/2846835
JMIR Mental Health / ScienceDirect, mental health chatbot evaluation and conversational trajectory safety discussion, 2026: https://www.sciencedirect.com/org/science/article/pii/S236879592600034X
夜雨聆风