OpenClaw 工具引擎架构全解析:AI Agent 的＂双手＂是怎么工作的?-夜雨聆风

OpenClaw 工具引擎架构全解析:AI Agent 的＂双手＂是怎么工作的?

大语言模型很会”想”，但它自己不能读文件、不能跑命令、不能上网。AI Agent 之所以能真正干活，靠的是一套工具引擎——它是 Agent 的”双手”，负责把模型的思考变成实际操作。

OpenClaw 的工具引擎不是一个单体模块，而是由 Agent Runtime 和 Gateway 两端协同执行：Runtime 负责调度工具调用，Gateway 负责管理浏览器实例、MCP Server 进程等重资源。两者通过 Session 共享状态。

这套引擎的设计相当精巧：三层工具体系、权限-审批-沙盒三重安全网、并行执行、自动容错。这篇文章从源码层面拆解它的每一个环节。

读完这篇你会了解：

一、一个工具调用的完整旅程

在深入细节之前，先看全局：当模型决定调用 exec ls -la 时，工具引擎到底做了什么？

场景	处理	设计思路
包含需审批的 exec	不需审批的先执行；需审批的发送审批请求，等待回复后执行；全部完成后合并返回	不让审批阻塞其他无关工具
write 后接 read 同一文件	并行执行，read 可能读到旧内容；模型会在下一轮修正	刻意选择了”最终一致”而非”强一致”——要做依赖分析的成本远超偶尔多一轮对话的成本
并行数限制	maxParallelTools（默认 10），超过则队列化执行	防止 fork bomb 式的资源耗尽

故障场景	处理
工具不存在	返回结构化错误给模型，模型换方案
权限不足	`"Permission denied: {tool}"` 给模型
执行超时	SIGTERM → 5s → SIGKILL → timeout 错误
exec 退出码非零	返回 stderr 给模型（不标记为 isError），模型可能需要 stderr 信息来修正
MCP Server 挂	标记不可用 → 后台重连 → 告知模型
Skill OAuth 过期	refresh → 失败 → 请求用户重新授权
浏览器崩溃	重启 Chromium → 重新导航
磁盘满	write 失败 → 告知模型 → 建议清理
网络不通	web/browser 超时 → 告知模型