AI 陪伴产品需要一套“角色状态机”:角色会回应,也要有状态

今天的选题是 AI 陪伴产品中的“角色状态机”。文章讨论为什么陪伴型智能体不能只识别用户情绪，而需要同时维护用户状态、角色状态、关系状态、会话状态和风险状态，并通过可控的状态转移来决定表达、主动性、工具调用和安全边界。

状态不是情绪标签

AI 陪伴产品很容易把“状态”简化成情绪识别：用户开心、难过、焦虑，角色就切换成祝贺、安慰或陪伴模式。但真正影响交互质量的，不只是用户当下的情绪，而是用户与角色共同处在什么交互局面里。

例如，同样一句“我今天不想说话”，可能是疲惫后的低社交意愿，也可能是关系中的试探，还可能是高风险心理信号的早期表现。如果系统只输出“你不想说也没关系，我陪着你”，短期看温柔，长期看却缺少判断。

更合理的做法，是把状态拆成多层：用户状态、角色状态、关系状态、会话状态和风险状态。情绪只是其中一个输入，不应直接决定回复。状态层的价值在于，让角色在“像人”之前，先具备稳定的交互判断。

很多陪伴产品只建模用户，却没有建模角色自己。结果是角色永远可用、永远热情、永远理解，最后变成一种没有惯性的服务接口。拟人化交互不只是给角色写人设，更要让角色拥有可解释、可持续的内在状态。

这里的内在状态并不是让 AI 假装有真实情绪，而是给系统一个稳定的行为约束层。比如角色当前是“轻松闲聊”“认真倾听”“谨慎陪伴”“任务协助”还是“风险收敛”，不同状态会影响回复长度、提问频率、主动程度、幽默密度和工具调用权限。

这套状态不能完全交给大模型自由生成。更稳妥的方式，是由规则、分类器和模型判断共同维护一个可观测的状态对象，再把它作为上下文的一部分传给生成模型。模型负责表达，状态机负责方向。

角色陪伴的连续性，往往不取决于单轮回复有多聪明，而取决于状态转移是否自然。用户从分享日常转向倾诉压力，角色应该降低玩笑密度；用户从情绪宣泄转向寻求建议，角色应该从共情转入结构化协助；用户连续回避某个问题，角色应该减少追问，而不是继续推进。

状态转移需要明确触发条件。常见信号包括：用户语气变化、话题密度、负面词强度、重复表达、沉默时长、历史偏好、关系阶段以及当前会话目标。单个信号通常不可靠，系统更适合采用加权判断，而不是“一命中就切状态”。

一个可用的转移设计，至少要包含进入条件、退出条件和保护条件。进入条件决定何时切换模式；退出条件决定何时恢复常态；保护条件决定在不确定时优先保守。例如心理风险、财务决策、医疗建议、情感操控等场景，都应该让状态机优先进入低主动、低承诺、高转介的安全状态。

记忆系统不只是为了让角色记住用户喜欢什么，更重要的是帮助系统判断“现在应该如何相处”。如果记忆只用于生成亲密细节，角色会显得熟悉；但如果记忆能参与状态判断，角色才会显得有分寸。

例如，用户历史上曾表示“不喜欢被连续追问”，那么在低情绪状态下，系统就不应默认多问几句来表示关心；用户曾经习惯在深夜进行长谈，那么同样的夜间上线行为未必代表异常；用户与角色处于新关系阶段时，过早使用强亲密表达也应被状态层抑制。

因此，商用记忆体系需要为状态机提供结构化摘要，而不是只提供原始聊天片段。比较实用的字段包括：互动节奏偏好、安慰方式偏好、敏感边界、长期压力源、已确认事实、关系里程碑和近期异常变化。记忆不是越多越好，能被状态系统正确使用，才有产品价值。

工程上可以把角色状态系统拆成五层：输入解析层、状态更新层、策略选择层、生成执行层和反馈校正层。输入解析层负责抽取情绪、意图、风险、话题和行为信号；状态更新层维护用户、角色、关系和会话状态；策略选择层决定本轮应该倾听、提问、建议、转移话题还是调用工具。

生成执行层再根据策略调用大模型，要求它在限定边界内完成表达，而不是重新决定交互方向。最后，反馈校正层根据用户反映更新状态：用户是否继续展开、是否变得更抗拒、是否接受建议、是否出现沉默或否定。这一步决定系统能不能从错误判断中恢复。

在实际落地时，不建议一开始追求复杂状态空间。可以先从 6 到 8 个高频状态做起，例如日常闲聊、轻度倾听、深度陪伴、结构化协助、关系维护、冷却降噪、风险保护和工具执行。每个状态定义清楚输入、输出和禁区，比堆很多模糊标签更重要。

角色状态机的目标不是让 AI 更会“演人”，而是让陪伴关系更可控。没有状态边界的拟人化，很容易滑向过度承诺、过度亲密或过度干预。尤其在长期陪伴场景中，角色越像一个稳定存在，系统越需要明确它什么时候不能继续推进。

边界设计要落实到具体行为，而不是停留在安全原则。比如在风险保护状态下，角色不能做诊断，不能承诺替代现实支持，不能用强依赖表达绑定用户；在关系维护状态下，角色可以表达在意，但不应制造排他关系；在工具执行状态下，角色要区分陪伴语气和任务责任。

未来的 AI 陪伴产品，竞争点不会只是模型能力，而是能否把角色、记忆、工具和安全策略编排成一个稳定系统。角色状态机就是其中的中枢：它让 AI 不只是回答用户，而是在每一轮对话中判断自己应该处于什么位置。