今天的选题是 AI 陪伴产品中的“角色状态机”。文章讨论为什么陪伴型智能体不能只识别用户情绪,而需要同时维护用户状态、角色状态、关系状态、会话状态和风险状态,并通过可控的状态转移来决定表达、主动性、工具调用和安全边界。
状态不是情绪标签
AI 陪伴产品很容易把“状态”简化成情绪识别:用户开心、难过、焦虑,角色就切换成祝贺、安慰或陪伴模式。但真正影响交互质量的,不只是用户当下的情绪,而是用户与角色共同处在什么交互局面里。

例如,同样一句“我今天不想说话”,可能是疲惫后的低社交意愿,也可能是关系中的试探,还可能是高风险心理信号的早期表现。如果系统只输出“你不想说也没关系,我陪着你”,短期看温柔,长期看却缺少判断。

更合理的做法,是把状态拆成多层:用户状态、角色状态、关系状态、会话状态和风险状态。情绪只是其中一个输入,不应直接决定回复。状态层的价值在于,让角色在“像人”之前,先具备稳定的交互判断。
角色也需要内在状态
很多陪伴产品只建模用户,却没有建模角色自己。结果是角色永远可用、永远热情、永远理解,最后变成一种没有惯性的服务接口。拟人化交互不只是给角色写人设,更要让角色拥有可解释、可持续的内在状态。

这里的内在状态并不是让 AI 假装有真实情绪,而是给系统一个稳定的行为约束层。比如角色当前是“轻松闲聊”“认真倾听”“谨慎陪伴”“任务协助”还是“风险收敛”,不同状态会影响回复长度、提问频率、主动程度、幽默密度和工具调用权限。

这套状态不能完全交给大模型自由生成。更稳妥的方式,是由规则、分类器和模型判断共同维护一个可观测的状态对象,再把它作为上下文的一部分传给生成模型。模型负责表达,状态机负责方向。
状态转移决定体验
角色陪伴的连续性,往往不取决于单轮回复有多聪明,而取决于状态转移是否自然。用户从分享日常转向倾诉压力,角色应该降低玩笑密度;用户从情绪宣泄转向寻求建议,角色应该从共情转入结构化协助;用户连续回避某个问题,角色应该减少追问,而不是继续推进。

状态转移需要明确触发条件。常见信号包括:用户语气变化、话题密度、负面词强度、重复表达、沉默时长、历史偏好、关系阶段以及当前会话目标。单个信号通常不可靠,系统更适合采用加权判断,而不是“一命中就切状态”。

一个可用的转移设计,至少要包含进入条件、退出条件和保护条件。进入条件决定何时切换模式;退出条件决定何时恢复常态;保护条件决定在不确定时优先保守。例如心理风险、财务决策、医疗建议、情感操控等场景,都应该让状态机优先进入低主动、低承诺、高转介的安全状态。
记忆要服务状态判断
记忆系统不只是为了让角色记住用户喜欢什么,更重要的是帮助系统判断“现在应该如何相处”。如果记忆只用于生成亲密细节,角色会显得熟悉;但如果记忆能参与状态判断,角色才会显得有分寸。

例如,用户历史上曾表示“不喜欢被连续追问”,那么在低情绪状态下,系统就不应默认多问几句来表示关心;用户曾经习惯在深夜进行长谈,那么同样的夜间上线行为未必代表异常;用户与角色处于新关系阶段时,过早使用强亲密表达也应被状态层抑制。

因此,商用记忆体系需要为状态机提供结构化摘要,而不是只提供原始聊天片段。比较实用的字段包括:互动节奏偏好、安慰方式偏好、敏感边界、长期压力源、已确认事实、关系里程碑和近期异常变化。记忆不是越多越好,能被状态系统正确使用,才有产品价值。
实现上要分层闭环
工程上可以把角色状态系统拆成五层:输入解析层、状态更新层、策略选择层、生成执行层和反馈校正层。输入解析层负责抽取情绪、意图、风险、话题和行为信号;状态更新层维护用户、角色、关系和会话状态;策略选择层决定本轮应该倾听、提问、建议、转移话题还是调用工具。

生成执行层再根据策略调用大模型,要求它在限定边界内完成表达,而不是重新决定交互方向。最后,反馈校正层根据用户反映更新状态:用户是否继续展开、是否变得更抗拒、是否接受建议、是否出现沉默或否定。这一步决定系统能不能从错误判断中恢复。

在实际落地时,不建议一开始追求复杂状态空间。可以先从 6 到 8 个高频状态做起,例如日常闲聊、轻度倾听、深度陪伴、结构化协助、关系维护、冷却降噪、风险保护和工具执行。每个状态定义清楚输入、输出和禁区,比堆很多模糊标签更重要。
边界比拟人更重要
角色状态机的目标不是让 AI 更会“演人”,而是让陪伴关系更可控。没有状态边界的拟人化,很容易滑向过度承诺、过度亲密或过度干预。尤其在长期陪伴场景中,角色越像一个稳定存在,系统越需要明确它什么时候不能继续推进。

边界设计要落实到具体行为,而不是停留在安全原则。比如在风险保护状态下,角色不能做诊断,不能承诺替代现实支持,不能用强依赖表达绑定用户;在关系维护状态下,角色可以表达在意,但不应制造排他关系;在工具执行状态下,角色要区分陪伴语气和任务责任。

未来的 AI 陪伴产品,竞争点不会只是模型能力,而是能否把角色、记忆、工具和安全策略编排成一个稳定系统。角色状态机就是其中的中枢:它让 AI 不只是回答用户,而是在每一轮对话中判断自己应该处于什么位置。
夜雨聆风