

从学术争议到循证检验
2023年,全球约9.7亿人受到精神障碍困扰,但超过70%的患者未接受任何专业治疗(WHO, 2022)。咨询/治疗师短缺、费用高昂、地域限制、病耻感——这些结构性障碍使得传统面对面心理咨询难以触达大多数有需要的人。
在此背景下,AI驱动的对话式心理服务(俗称“AI心理咨询”)被寄予厚望:它们24小时在线、成本低廉、无病耻感门槛,理论上能够填补巨大的服务缺口。
但“能用”和“有效”之间隔着一道鸿沟——
AI聊天机器人究竟能在多大程度上缓解抑郁和焦虑?
它的效果是否经得起随机对照试验(RCT)的检验?
效果能持续多久?
对哪些人群更有效?
......
2023年发表在 npj Digital Medicine 上、由Li等人完成的系统综述与元分析,以及2026年同一期刊上由Sohn等人发表的最新元分析,恰好构成了一个从“初步证据”到“大规模验证”的递进视角。
前者纳入15项RCT、1744名参与者,聚焦AI对话代理(Conversational Agents, CAs)对心理困扰和心理健康的综合效果;后者将样本扩展至39项RCT、超过7400名参与者,专门检验聊天机器人对抑郁和焦虑症状的效果。
两篇论文合在一起,为我们拼出了一幅相对完整的AI心理咨询效果图谱。

核心发现:
有效,但效果量偏小到中等
2023年Li等人的研究发现,与对照组相比,AI对话代理在减轻心理困扰方面显示出较大效果量(Hedges' g = 0.70, 95% CI 0.18–1.22)。
在具体的抑郁症状上,效果量为 g = 0.64,属于中等偏大。
然而,对焦虑的改善虽然数值上看起来不小(g = 0.65),但由于置信区间跨越零点(–0.46 至 1.77),未达到统计学显著水平。
更值得关注的是,AI对话代理对整体“心理健康”(well-being)的促进效果仅为 g = 0.32,同样未达显著——
这说明AI在“减少痛苦”方面有一定作用,但在“提升幸福感”方面证据尚不充分。
2026年Sohn等人的研究纳入了更大规模的样本(38项抑郁分析、34项焦虑分析),结果更为审慎:
聊天机器人对抑郁症状的缓解效果为 g = 0.31,对焦虑症状为 g = 0.28,均达到统计显著但仅属于小效果量。
两个效果的差异从何而来?
一方面,2026年的研究纳入了更多近期发表的大规模试验,这些试验设计更严谨、样本更多元,可能对效果量有“稀释”效应。
另一方面,2023年研究中生成式AI对话代理(如基于大语言模型的聊天机器人)展现了高达 g = 1.24 的效果量,远高于检索式(g = 0.52),但生成式AI的相关试验数量较少,拉高了整体均值。随着更多生成式AI试验加入,效果量向均值回归是正常现象。
综合来看,AI心理咨询对抑郁和焦虑确实有统计学显著的缓解作用,但效果量处于小到中等之间——比“完全无效”好得多,但也远未达到“可以替代人类咨询师”的程度。
作为参照,传统面对面心理治疗对抑郁的效果量通常在 g = 0.5–0.8 之间。

短期有效,长期存疑
一个更令人警醒的发现是:AI心理咨询的效果很可能集中在短期。
多项元分析一致指出,干预结束后随访期间,聊天机器人对大多数心理健康指标的效果不再显著。Li等人(2023)的分析中,长期效果量从短途的显著水平降至接近零。
2026年发表在 JMIR 上针对CBT导向聊天机器人的元分析也发现,抑郁的长期效果从 g = –0.55(干预后立即)降至 g = –0.32(随访期),焦虑则从显著变为不显著(g = –0.19)。
这意味着什么?
AI聊天机器人可能更像一个“情绪急救包”——在使用的当下能提供一定支持,但一旦停止互动,效果会逐步消退。
这与传统心理治疗形成对比:研究表明,面对面心理咨询效果在干预结束后仍能维持较长时间,因为来访者在咨询过程中内化了新的认知模式和应对策略。
而AI对话的交互模式——往往是引导用户完成结构化练习(如CBT认知重构、正念呼吸)——可能更依赖“外部脚手架”,一旦脚手架撤除,改变难以自我维持。

哪些因素决定了效果的好坏?
两篇论文及同期其他元分析揭示了几个关键的调节变量:
第一,人群差异显著。
2026年Sohn等人的研究发现,AI聊天机器人对临床样本(已确诊或正在接受治疗)和亚临床样本(有明显症状但未达诊断标准)的抑郁缓解效果显著优于非临床样本(一般人群)。
这并不意外:有真实痛苦的人更容易从干预中获益,而“没事的人”本来就没什么可改善的空间。
第二,技术架构的影响。
2023年Li等人的研究发现,生成式AI(基于大语言模型,能实时生成个性化回应)的效果量(g = 1.24)显著高于检索式AI(从预设数据库中匹配回复,g = 0.52)。多模态/语音交互(g = 0.83)也优于纯文本交互(g = 0.67)。
然而,2026年的一项针对青少年的元分析却给出了不同结论:检索式聊天机器人反而展现出更一致、更可靠的效果,而生成式系统的整体效果“尚不确定”。
这种矛盾提示我们,生成式AI的潜力更大,但稳定性尚需更多试验验证——早期的小样本试验可能放大了效果量。
第三,共情与个性化是核心催化剂。
多项研究一致发现,具备共情回应能力和个性化适配的聊天机器人效果更好。
用户正面体验的核心因素包括:共情沟通、非评判性态度、定期签到带来的责任感、类人个性。
反过来,沟通中断(机器人答非所问)、内容重复机械、缺乏人情味是最常见的放弃使用原因。
第四,社交导向优于任务导向。
一项专门针对生成式AI聊天机器人的元分析发现,以社交互动为主要功能的聊天机器人(如陪伴型对话)效果优于以任务执行为导向的(如引导完成CBT练习)。
这暗示AI心理咨询的价值可能不仅在于“传递治疗技术”,更在于提供一种持续的情感陪伴。

用户怎么看?
接受度与隐忧并存
从用户体验的定性分析来看,AI心理咨询的接受度呈现两极化。
正面评价集中在:随时可用的便捷性、没有病耻感(不用担心被人看到去看心理医生)、不会感到被评判。
一些用户报告与AI建立了类似"治疗联盟"的关系——这令人惊讶,因为对面毕竟是机器。
但负面体验同样值得警惕。
沟通中断是最突出的问题:当用户表达复杂情感时,AI的回应往往显得模板化或离题。
更深层的隐忧在于——一些用户明确表达了对人工支持的偏好,认为AI缺乏“真正理解”的能力。这种“恐怖谷”效应可能在情感深度增加时变得更加明显。

证据质量:需要保持清醒
两篇论文都采用了GRADE体系对证据质量进行评级,结果并不乐观。
Li等人将AI对话代理减轻心理困扰的证据评为“中等”,提升心理健康的证据评为“低”;2026年Sohn等人的研究同样面临异质性过高(I² > 75%)、发表偏倚(抑郁结果的Egger检验显著)、以及大量研究存在盲法缺失等问题。
这些方法学局限意味着:现有证据的方向大致可靠(AI确实有一定效果),但具体效果量可能被高估。
随着更多高质量、大样本试验的加入,真实效果量可能进一步收缩。

对中国心理健康服务的启示
回到国内语境。
2026年4月发布的《健全社会心理服务体系和危机干预机制实施方案》提出了2030年建成全人群全周期心理服务体系的目标,但基层心理服务人才缺口巨大。
同时,抑郁症已被纳入门诊慢特病管理,心理治疗项目逐步纳入医保——这些政策正在快速扩大心理健康服务的覆盖面。
AI心理咨询在这一背景下有其独特价值:
它可以作为分层服务体系中的“底层支撑” ,为轻度至中度症状人群提供即时、低门槛的初步支持;可以作为等待人工服务期间的过渡工具;也可以作为治疗期间的辅助练习平台。
但,它不应被视为专业治疗的替代品——尤其是对于重度抑郁、有自杀风险、或需要深度心理工作的来访者。
值得注意的是,目前国内多数AI心理产品仍处于早期阶段,缺乏严格的RCT验证。国际元分析中的正面结果主要来自欧美和东亚发达国家的试验,在中国大陆的大规模验证仍然有限。
在引入和推广AI心理咨询工具时,需要警惕“技术乐观主义”陷阱——效果量小到中等、长期效果不确定、证据质量中等偏低,这些事实不应被商业宣传所遮蔽。
结语
综合两篇论文及同期元分析的证据,AI心理咨询的定位应该是清晰的:
它是一个有价值的补充工具,对抑郁和焦虑有统计学显著但效果量偏小的缓解作用,短期效果优于长期,对有真实痛苦的人群效果更好,共情和个性化是提升效果的关键。
但,在将其大规模部署到公共心理健康服务体系之前,我们还需要更多高质量的中国本土RCT数据、更长期的随访证据、以及更严格的安全监控机制。
技术能做到的事正在快速扩展,可心理咨询的核心——一个人对另一个人的深度理解与陪伴——目前仍是AI无法抵达的领域。
在“AI能做什么”和“人需要什么”之间找到恰当的平衡点,才是真正负责任的推进方式。
参考文献:
Li, H., Zhang, R., Lee, YC. et al. Systematic review and meta-analysis of AI-based conversational agents for promoting mental health and well-being. npj Digital Medicine, 6, 236 (2023). https://doi.org/10.1038/s41746-023-00979-5Sohn, JS., Ha, BG., Park, S. et al. Systematic review and meta analysis of chatbots in the management of depressive and anxiety symptoms. npj Digital Medicine, 9, 377 (2026). https://doi.org/10.1038/s41746-026-02566-wHe, Y. et al. Conversational Agent Interventions for Mental Health Problems: Systematic Review and Meta-analysis of Randomized Controlled Trials. JMIR, 2023.Gong, X. et al. Efficacy, User Engagement, and Acceptability of CBT-Oriented Psychological Chatbots. JMIR, 2026.
免责声明: 本文基于公开发表的学术论文进行综述分析,仅供学术讨论和信息参考,不构成任何医疗建议或治疗推荐。如有心理健康需求,请咨询专业医疗机构。

2026年心理咨询师培养计划
开营补录,名额有限!!
怀揣咨询师梦想的你
快来「执业心理咨询师培养计划」
开始你的执业第一步吧~
▽▽▽

↑点击图片,添加壹心理规划师,免费职业规划↑
① 专业顾问1V1职业规划
②全套108页《心理咨询师入行手册》
想入行该问谁?
试试加入【咨询师入行】交流群
↓↓↓↓↓

扫码加入
备注:入行
适合:所有想成为咨询师的朋友
分享:入行资讯、入行交流、个案演示、学习资源
第三代咨询师:“第三代”心理咨询师到底是什么丨后证书时代,心理咨询师的升级换代丨后现代的心理咨询,要用“服务”取代“治疗”丨心理咨询师要放下ego,当好服务者丨为什么说优秀的咨询师一定要会吃喝玩乐?
热门文章:心理/精神健康领域正经历一场静默的革命丨AI已经在精神病院上班了丨越来越多女性,确诊PMS丨新型“精神病”正在将孩子们推向深渊丨央广网揭秘天价“心理疗愈课”骗局
行业资讯:《健全社会心理服务体系和危机干预机制实施方案》发布丨2026两会声音汇总丨2025世界一流心理学科排名出炉丨《学校心理健康教师专业能力标准》正式发布丨教育部公布多所高校心理学通过二级认证
夜雨聆风