它不知道消息是从哪个渠道来的
它记不住跨轮、跨天、跨流程的任务状态
它不会安全、稳定地调用企业内部工具
它无法长期运行,也无法被调度
它很难被审计、治理和排障
01
用户发一句话 大模型理解一下 生成一段答案 返回给用户
问答
文案润色
内容总结
知识解释
一次性查询






消息从哪里来
用户是谁
现在处在哪个会话里
是否有历史状态
是否需要调用工具
工具是否有权限
执行是否成功
中途失败怎么办
结果如何通知
任务能否跨天继续
整个过程如何审计
02

飞书
企业微信
Telegram
邮件
Web 页面
内部系统按钮
定时任务
外部 webhook 事件
他说的是哪个审批
这个人是谁
他是否有权限催
现在审批在哪个状态
前面已经发生了什么
查数据库
调 API
发消息
打开浏览器
在页面里执行动作
写文档
更新状态
创建任务
今天发起,明天回调
这一步完成后,等待下一步
周一创建,周日检查
某个人还没处理,就继续挂起
收集需求
生成 JD
审批
发岗位
搜候选人
初筛
邀约
面试
决策
入职协同
03
模型选哪家
prompt 怎么写
要不要接向量库
function calling 怎么做
输入统一:不同渠道、不同格式、不同用户身份,怎么统一成一个内部可处理的消息模型? 会话隔离:同一个用户在不同群、不同线程、不同渠道里说的话,哪些应该共享上下文,哪些不能共享? 上下文装配:不是把所有历史对话都扔给模型,而是要构建“当前任务所需的最小充分上下文”。 Agent 决策:什么时候直接回答?什么时候调用工具?什么时候启动长任务?什么时候需要换一个 Agent 来处理? 工具执行:工具如何定义、如何限权、如何审计、如何重试、如何保证稳定? 状态与记忆:系统如何记住一个长期任务的进展?如何保留用户偏好?如何存储流程状态?如何避免记忆污染? 调度与恢复:任务中断了怎么办?外部系统超时怎么办?定时任务如何管理?失败后怎么恢复? 安全与治理:谁能访问什么数据?哪些动作需要确认?模型上下文里能不能带敏感信息?整个过程如何审计?
04

接消息
管上下文
调工具
存状态
执行任务
处理失败
审计行为
返回结果

05

来自哪个租户
哪个渠道
哪个群
哪个线程
谁发的
文本内容是什么
是否有附件
是否 @ 了机器人
这是谁
他是否有访问这类信息的权限
这条消息属于哪个会话
当前会话是否已有历史状态
最近几轮相关对话
当前用户身份
这个团队的周报配置
历史任务状态
相关成员名单
可用工具列表
调用“周报检查工具”
或启动一个“周报审计流程”
打开浏览器
进入目标站点
找到本周周报目录
读取成员填写情况
判断哪些人未提交
如有需要,发送提醒消息
本周目录名称
已提交名单
未提交名单
通知是否发出
当前任务状态

本次是谁触发的
用了哪些工具
调用了几次
是否成功
花了多少时间
有没有异常
06
prompt 怎么写
模型怎么选
回答怎么更像人
误发消息
重复建单
越权查询
写错数据
删除错误内容
记住了过期信息
记住了错误偏好
把临时对话当成长久事实
向量检索召回了不该召回的内容
这个 Agent 能看到哪些数据
它代表谁在行动
它做了什么动作
万一出错,谁能追溯
07
接渠道
管上下文
调工具
跑任务
维护状态
输出结果
理解人话
判断意图
拼装上下文
选择工具
跨系统编排
多渠道
多会话
多 Agent
记忆系统
状态管理
调度系统
安全治理
审计与观测
08
渠道视角:它是怎么接收消息、统一格式、隔离会话、输出回复的? 上下文视角:它是怎么把当前任务真正需要的信息装配给模型的? 执行视角:它怎么让模型和工具协同,把事情真正做完? 状态视角:它怎么记住流程进展、长期任务、异步状态和跨轮信息? 治理视角:它怎么保证安全、权限、审计、可观测、可恢复?
09
有 Prompt
有 Tool
有 Memory
有 Vector DB
有 Browser Agent
为什么要有 Channel Adapter
为什么要做会话隔离
为什么上下文不是聊天记录拼接
为什么工具调用要有权限和审计
为什么记忆不能乱存
为什么长任务必须有状态机
为什么一个企业 Agent 平台最终比拼的是治理能力
10

11
消息进入系统后,第一步做什么
怎么做身份识别和会话定位
上下文是怎么装配的
模型如何决定是否调工具
工具执行结果怎么回流
最终回复又是怎么输出到渠道里的
夜雨聆风