立足在真实业务环境中的AI产品,始终要围绕一件事:产出确定性结果,建立用户信任。
人因工程领域的研究指出:用户对自动化系统的信任取决于三个变量——系统可靠性、用户对错误后果的感知强度以及用户自身能不能干预纠正。而Kahneman的前景理论进一步指出,人对"失去"的感知强度是"获得"的两倍以上——AI产品出一次错,后面十次对了都拉不回来。
之前的文章中讲过一个解决方案,摸透能力边界来做分工边界。
这篇文章讲的是第二个解决方案,AI做什么、代码做什么、人做什么的分工明细之后,AI依然会出错,怎么用安全线来防错和兜底。
01
两种常见的回避姿势
目前我观察到两种常见的处理方式:
第一种:测试通过就上线。 demo跑得通、效果还行,那就上。至于AI出错了怎么办——"出了再说"。
第二种:怕出错就不上。 因为大模型输出不可控,关键环节一律不用AI。结果AI只能做做摘要、写写文案,没机会碰核心业务。
这两种都是在回避一个问题:安全线画在哪。
拆开来看其实就是这3层:AI可以错到什么程度、错了谁来兜底、怎么让用户知道这里有风险。
下面用三个不同类型的AI产品,聊聊三条不同的安全线。
02
第一条安全线:数据不能错
场景:一个类AI问数产品。 用户用自然语言问库存数据,AI生成SQL取数,返回结构化答案。
数据类AI产品最怕的不是"答不出来",而是AI把自然语言翻译成SQL的时候翻错了,但用户很难发现。
比如用户问"昨天华北仓的缺货率",AI要识别出三个维度:时间=昨天、仓库=华北仓、指标=缺货率。只要其中任何一个维度识别错了(比如把"华北仓"识别成"华北区"),SQL跑出来的是另一组数据,但数字本身看起来还是一个"合理的数字"——用户不一定会察觉这是"对另一个问题的回答"。
这类错误的特点是隐性——不报错、不异常,只是"答错了一个用户没问的问题"。
所以面对这类产品,产品侧能画的安全线核心逻辑是:越隐性的错误,越要重的防线。 具体可以展开成三条:
第一,规则硬约束:关键定义不能让AI自己编。
不同业务域定义不一样。业务指标口径必须在代码里写死,AI只负责识别"用户问的是哪个指标",不允许自己定义计算公式,也不能用通用的训练知识库来定义真实业务的指标口径。
专家规则库+核心业务指标的触发条件,就是这条安全线——AI的泛化能力是"理解问题",无法做到"定义指标"。
第二,把AI的不确定性写在答案里,不打断用户。
AI的输出不该是"全信或全不信",但让用户看见不确定性 ≠ 弹窗打断用户。更合适的做法是:AI按最高置信度的理解直接出答案,在答案卡片上显性标注"已按'华北仓'查询";如果有多个候选维度(比如"华北仓"和"华北区"都可能),把备选项放在答案旁边,一键可切换。
用户不需要先回答"你到底想查什么"才能看到结果,但如果AI理解偏了,一眼能看到、一键能纠正。
第三,可追溯的查询路径:让用户看见AI理解成了什么。
AI给了一个数字,用户凭什么信?光靠AI自己解释不够——业界已经观察到模型的思维链和实际推理行为经常对不上。更踏实的做法是把每次查询展开成链条:"原始问题 → 识别到的维度 → 生成的SQL → 执行结果 → 答案卡片"。用户看到的是答案,但点进去能看到"AI把你的问题理解成了什么"——如果维度识别错了,用户看这一步就能揪出来。
这三条的共同点:人始终在决策环路里面。 不一定每步都确认,但每一步都留了让人介入纠错的入口。
因为数据类AI产品的错误成本在于过于消耗用户的信任度,一次出错印象极深刻。所以产品设计要为"人能兜住"铺好每一道门。
03
第二条安全线:记忆不能丢
场景:多轮对话类AI产品。 所有需要跨会话记住上下文的AI产品——无论是企业级的智能助手、客服Agent还是个人效率工具——都会遇到同一个问题。
这类产品的安全问题和数据类AI完全不同——不是数据算错,而是AI记错了或记丢了。
一个真实的踩坑场景:上午在一个会话里跟AI确认了方案的5个核心逻辑,下午新开一个会话想接着写,问它"核心逻辑是什么"——它给我列了3条,全是另一个方案的内容。
原因很简单:AI的记忆是平的。Transformer对所有token一视同仁,没有"这个重要、那个不重要"的层次。对话变长之后,远处的信息和近处的信息权重趋同,模型逐渐"记混"。这个问题在企业场景里更严重——客服Agent忘了用户上一轮投诉的问题、项目助手丢了上周的决策结论,影响的不止是体验,是业务连续性。
所以这条安全线的核心逻辑是:AI的记忆靠不住,产品设计要替它兜底。
我的数字分身承载产品Qoder有三种记忆容器:长期记忆(Memory)放频繁变化的信息、Skill固化稳定的偏好、会话上下文(Context)装临时想法。这是工具提供的分层。但分层不等于记忆就不会丢。我在这个基础上加了两件事:
第一,双写机制。 重要的东西不能只存在对话里,必须同步落到具体文件里。会议纪要、产品方案、复盘材料,每个材料有自己的目录位置。AI说过的话只在对话窗口里飘着,下次新开一个会话就找不回来;落到文件里,半年后回头翻还能看。
第二,信源三问。 AI会忘事,更危险的是它会"编事"——把记不清的内容补成一段看起来合理的话。所以每次它给我一个结论,我都会追问三句:来源于哪?是原文还是解读?能不能标注?写这篇文章的过程里就拦下过一次——它给我引了一句某个产品设计指南里的"经典原文",追问之后才发现,那句不是原文,是它自己意译加工的。
而这些和AI问数的安全线有一个关键区别:人不需要参与每一步决策,但需要在关键节点做校验。
日常规划、任务排序,AI自己跑就行,我看结果。但记忆写入、跨会话传递这些环节,我需要能看到"它记了什么",发现不对能纠正。
AI在跑,人在旁边看着。大多数时候不介入,出了异常再拉回来。
04
第三条安全线:能力不能越级
场景:AI Agent能力平台的治理问题。 当企业开始大量部署Agent/Skill——无论是内部效率工具还是面向客户的智能服务——就会遇到一个新问题:这些能力之间有依赖关系,但没人管。
我用自己搭的一个小平台来说明这个问题。把几十个Skill按能力类型分成三层,按依赖关系组织起来。
这个场景的安全问题又不一样了——不是某个环节出错,而是AI做了超出当前能力的事。
这些Skill按依赖关系分了三类:
· 操作型:做数据准备、一致性校验这类基础活——确保数据准确,这是地基。
· 分析型:基于准确数据做统计和分析——输出可复用的结论。
· 知识型:基于分析结论给出决策建议,进阶可触发行动。
这三层有严格的依赖链:操作型保证数据准确 → 分析型才能产出可靠结论 → 知识型才能给出有效建议。
安全问题就出在这里:如果操作型的Skill还没跑通(数据还不准),分析型就开始出报告,报告里的数字是假的;如果分析型还没验证,知识型就开始给建议,建议是建立在沙子上的。
所以这条安全线的核心逻辑是:若能力有依赖关系,上一层没就位,下一层不能开。
具体的设计是:
每层Skill有独立的质量标准。 操作型要求数据准确率达标,分析型要求结论可复现,知识型要求建议有数据支撑。上一层的质量标准没通过,下一层不解锁。
Skill之间的依赖链是显性的。 产品里标注了"这个Skill依赖哪些前置Skill",用户能看到完整的能力链条。不是把几十个Skill平铺出去让用户随便选,而是告诉用户"你要用这个能力,先确保这些前置条件具备了"。
这条安全线的人机关系又不同了:在单个Skill内部,AI可以自主执行;但在Skill之间的依赖关系上,需要产品规则来把关。
人不需要盯着每个Skill怎么跑,但需要有机制确保AI不会在地基没打牢的情况下就往上盖楼。
在 AI Agent 工作流的设计里,这个机制叫 Hook——在关键动作之前埋一个检查点,不过关不放。本质是一件事:在代价不对称的瞬间埋一个检查点。
05
三条安全线,指向同一个框架
回头看这三个案例:
· 数据不能错(问数类) —— 安全线重点是数据不能错,人在环中,每个关键节点确认
· 多轮对话类(跨会话AI助手) —— 安全线重点是记忆不能丢,人在环上,异常时介入
· 能力编排类(Agent平台) —— 安全线重点是能力不能越级,规则提前定好,人在环外,AI按规则自主执行
这三种人的角色,恰好对应之前聊过的人机协作三环——in the loop(人在环中)、on the loop(人在环上)、out the loop(人在环外)。
产品设计画安全线,本质上是在决定:这个环节,人应该在哪个环上。
关键是按场景定:错误成本高、信任未建立的环节,人在环中;AI已证明可靠、用户能抽查的环节,人在环上;规则清晰、依赖链完整的环节,人可以退到环外。
06
安全线不是终点,是信任升级的路径
安全线不是一成不变的。随着AI在某个环节证明自己靠谱,人可以从"在环中"退到"在环上",再退到"在环外"。
举个例子:一个AI环节,设计之初置信度不够就弹出来让人确认(in the loop);跑一段时间、积累了足够多真实数据后,如果这个环节的准确率稳定在较高水平,就可以把"每次确认"松到"抽查"(on the loop);再往后,如果抽查阶段也几乎挑不出问题,就可以让AI自己跑,只保留异常告警(out the loop)。
这就是渐进式信任——安全线的设计,让信任可以一步步升级,每一步都有数据撑着。
这是我认为AI产品经理未来很长一段时间都需要解决的问题,在兜底模型能力的基础上,如何构建产品和使用者之间的信任感。
END
我是老贺,医疗健康+供应链双行业产品人。
正在用AI搭建数字分身,把干过的活沉淀成方法论。
关注我,持续更新AI产品落地实战经验。
夜雨聆风