企业 AI 智能体五层架构之四:第四层不是选模型,而是给任务配能力

企业智能体架构的第四层，不是模型能力有多强，而是智能体能力如何围绕任务被正确组织。

前三层, 我们已经把智能体拉回了业务现场：

· 第一层：业务场景层——不是“做个智能体”, 而是“解决哪个具体动作”；

· 第二层：流程协同层——不是“有个入口”, 而是“在哪个流程节点接住输入、输出结果、有人确认”；

· 第三层：知识与数据层——不是“接了知识库”, 而是“每一步动作, 都说得清依据”。

走到这里, 很多团队会松一口气：场景定了, 流程接了, 依据也补了——那接下来, 是不是该选模型、配工具、上多智能体了？

别急.

第四层真正要解决的, 不是“用哪个大模型”, 而是：

这些智能能力, 到底该怎么分工, 才能支撑业务动作？

很多项目就在这一步散了架：能力清单列了5页, Demo跑得飞快, 上线后却卡在“下一步该谁干”。

问题不在模型弱, 而在能力没放对位置。

今天这篇, 不聊技术参数, 不列功能清单.我们只讲一件事：怎么把模型、规则、系统、工具和人, 编排成一套能进业务现场的执行队列.

一、能力组织的三大误判

我陪跑过的多个个企业智能体项目。其中大部分在第四层栽了跟头——不是模型不行, 是能力没配准.

误判1：把模型当任务

模型能理解、能生成、能推理, 但不等于它能完成一个真实业务动作.

某制造企业上线客服智能体, Demo时回复流畅、语气得体.上线三个月后, 客服主管反馈：“它生成的回复, 我得自己核一遍政策；涉及赔付的, 我得手动加免责条款；低风险问题它也标‘需升级’, 我得再判断。”

你猜问题出在哪？不是模型没能力, 是能力没分工.

客户说：“系统又登不上了, 上周报过一次, 再不处理我就投诉。”模型可以识出“情绪强”“重复问题”, 但不能自行判断“必须升级”——这要看客户等级、服务协议、响应时限三条规则.

✅ 业务解释：模型能生成, 不等于业务敢用.企业要的不是“AI会写话术”, 而是“AI在正确规则下生成可采纳的话术”。

误判2：把清单当方案

很多方案一上来就列能力：智能问答、知识检索、摘要总结、内容生成、数据分析、工具调用、任务规划、多智能体协同.

看起来很全.但企业真正要问的不是“它会什么”, 而是“它怎么完成一件事”。

某零售企业合同智能体, 功能齐全：识别类型、抽取条款、匹配规则、生成建议.结果法务反馈：“它提示的风险, 我得自己再核；生成的合同, 我得手动排版上传；修改意见, 还得手动同步给业务。”

问题出在哪？不是模型不行, 是能力没组合.

合同审核不是“读合同”一个动作, 而是6步链条:① 识别类型 → ② 抽取条款 → ③ 匹配规则 → ④ 标记风险 → ⑤ 生成意见 → ⑥ 交由确认.

模型干①②⑤, 规则干③④, 人干⑥.缺一环, 就只是“高级草稿机”。

✅ 业务解释：能力清单不是方案.能力之间形成业务承接, 才是方案.

误判3：把堆叠当组合

最危险的误判, 是把所有事都交给模型.

模型干理解、干判断、干生成、干调用、干确认……听起来很智能, 但业务往往不敢用.

为什么？因为真实业务里, 一件事需要多种能力协作：

· 模型负责理解与生成（看懂客户说的“系统卡了”, 生成回复草稿）；

· 知识检索负责找依据（查最新服务政策、历史案例)；

· 规则引擎负责定边界（客户等级触发升级、投诉次数超阈值）；

· 数据接口负责取事实（CRM查客户等级、工单系统查历史记录）；

· 人负责担责任（确认高风险回复、处理例外、最终拍板）。

上周陪跑某制造企业, CIO看到方案里“模型自动分派工单”, 当场删掉2页能力清单, 说：“别让AI替我担责。”

✅ 金句：AI不是万能工, 而是分工协作员。模型能跑得快, 但跑错方向, 企业不敢跟。

二、能力组织四问：今天就能用的自查清单

第四层不靠技术参数, 靠四个实操问题。挑一个你正在推进的智能体节点, 用这4问快速过一遍。答不出3条, 建议先停一停——不是技术不行, 是能力还没编排好。

问题	✅ 能说清	⚠️ 模糊	行动建议
1. 谁干哪一步？	例：模型识问题+生成建议；规则判升级；主管确认分派	仅写“AI自动完成”	拆成3类角色分工
2. 边界在哪？	低风险（字段抽取）可自动；中风险（回复建议）需确认；高风险（自动审批）禁自动	未区分风险等级	标出“必须人拍板”环节
3. 工具怎么调？	读数据可自动；写结果需确认；触发动作必须人工授权	未区分读/写/触发	明确调用权限与留痕要求
4. 结果怎么回？	用户可采纳/修改/驳回；反馈进入知识库；错误原因可追溯	无反馈机制	设计最小闭环：用→改→记→优

这张表, 我们已用在多个落地项目中.最常卡住的是第1条——能力没分工, 模型就得扛责.

三、能力分工三原则：模型干理解, 规则干判断, 人干确认

第四层的核心, 就三条铁律：

1. 模型干理解, 不干责任判断

模型擅长：读懂客户说的“系统卡了”, 总结工单里的关键信息, 生成回复草稿.它不适合：决定“该派给谁”“是否需升级”“能不能对外承诺”。

业务解释：模型可以识出“客户情绪强烈”, 但不能自行判断“必须升级至总监”——这要看客户等级、服务协议、响应时限三条规则.

2. 规则干判断, 不干模糊推理

规则引擎像交通信号灯：红灯停、绿灯行, 不能让AI自己猜.适合：客户等级触发升级、投诉次数超阈值、合同金额超权限等确定性条件.

业务解释：“VIP客户+投诉≥2次→必须升级”这条规则, 必须写死.如果让模型根据历史案例“推测”, 一旦漏判, 可能引发客诉升级.

3. 人干确认, 不干重复劳动

人不适合：手工查3个系统、翻10页制度、写5页PPT.人必须干：最终拍板、例外处理、责任归属、对外承诺.

业务解释：AI可以生成回复草稿;但“这句话能不能发给客户”, 必须由一线主管确认——因为一句措辞不当, 可能引发法律风险.

这三条不是技术选择, 是业务底线.

模型是笔, 规则是尺, 系统是桌, 人是校对员.缺了哪一环, 写出来的都不是正式文件.

四、结语：第四层的终点, 是让能力各就各位

企业不拒绝AI, 但拒绝“能力乱配的AI”。

一个真正能进流程的智能体, 应该像一支训练有素的小组：

· 模型是侦察兵：负责看懂现场、汇总信息;

· 规则是指挥官：负责下达确定性指令;

· 系统是传令兵：负责取真实数据、执行标准动作;

· 人是决策者：负责确认、例外处理和最终担责.

它不需要全能, 但必须分工清楚;它不需要最快, 但必须动作可靠.

五层架构走到第四层, 本质是回答：我们不是在建一个AI功能, 而是在为一个业务动作配一套“可信赖的执行班子”.

所以, 今天下班前, 做一件事:打开你的智能体方案, 删掉那页“能力清单”, 换成一张“能力分工表”：

任务动作	模型干	规则干	系统干	人干
工单问题识别	理解客户描述	校验分类标准	读取工单字段	处理低置信异常
客户风险判断	生成风险提示	判断是否触发升级	查询CRM等级	确认是否升级
处理团队推荐	生成推荐理由	匹配分派规则	查排班状态	最终确认分派

如果这三行能写清楚, 你的第四层, 就稳了.

——本文为“企业AI智能体五层架构”系列第四篇.前篇回顾：《第三层：智能体不敢用, 不是模型不行, 是依据不清》下篇预告：《第五层：智能体上线后, 谁负责让它越用越聪明？》如需本文「能力分工四问」PDF自查模板, 欢迎留言“分工表”, 我发你可直接套用的表格.