AI Agent 原来是一套会自我修正的控制系统
真正拉开 AI Agent 差距的,不是接了多少工具,也不是 Prompt 写得多复杂,而是它有没有一套“可验证、可恢复、可进化”的认知架构。
01|计划不是步骤列表,而是任务图
复杂目标先拆成“互不重叠、合起来又完整”的子问题,再把叶子节点变成原子任务。任务之间用依赖图连接,通过拓扑排序决定顺序,并按执行波次并行处理。
一个节点失败时,不必推翻全部计划,只替换失败节点及其受影响的下游子树。
02|执行前,先证明计划能执行
计划生成后不能立刻运行,还要经过三道检查:
静态验证:检查未知工具、缺失依赖、循环引用;
可行性分析:估算时间、成本和调用次数;
模拟执行:用假数据跑通上下游,提前发现输入输出不匹配。
03|失败不是“再试一次”,而是先诊断
工具超时、空结果、依赖缺失、步骤本身不可行,恢复方式完全不同。
更关键的是 Reflexion:每次失败后明确写下 ERROR、WHY、STRATEGY。下一次不是原样重试,而是带着新策略重新行动。已完成结果通过 checkpoint 保留,避免从头开始。
04|结果生成,不等于任务完成
成熟架构不是单个 Agent 从头跑到尾,而是:
Planner 负责规划,
Executor 负责执行,
Critic 负责逐步验收。
Critic 会在每个关键节点检查完整性、证据、约束和风险;必要时再引入“魔鬼代言人”,专门寻找计划中最致命的反例。
05|记忆不是保存聊天记录
真正有用的记忆,是“这类任务以前错在哪里、为什么错、后来什么策略有效”。
这些经验必须在相似任务中被检索并进入新一轮决策。只存不取的记忆,等于没有记忆。
06|推理也不只靠长上下文
知识图谱可以把文本转成实体、关系和路径,让 Agent 沿关系推理,并在输出前检测冲突。
工具选择也不必永久写死:可以根据历史成功率动态路由;不同任务则交给不同专长的 Agent。
AI Agent 的高级形态并不是“更会聊天”,而是一个拥有任务图、验证器、执行器、批评者、记忆系统和安全边界的控制系统。
自治的前提,从来不是放开权限,而是先具备监控、预算、回滚和人工升级机制。
夜雨聆风