OpenClaw和Claude Code让我重新理解了大模型的手脚(Tool Use)
年初 OpenClaw 的刷屏,火得有点离谱——各种晒单:自动清邮箱、跑周报、订机票、在飞书里指挥一排 Agent 协同干活。看得人心里痒痒的,大模型终于不只会聊天,而是有手有脚,真能替你干事了。
我兴冲冲装了一版,体验确实惊艳:你说一句「帮我把这周会议纪要整理成待办」,它真的会去翻文件、列清单、甚至改日历。那种「有个靠谱助理」的感觉,是以前AI纯问答给不了的。
但兴奋过后,我总会多问一句:它到底是怎么「动手」的?模型自己真的会调 API ,使用各种工具吗?
我问了DeepSeek ,结论可能有点扫兴。
模型并没有真的「伸手」
大模型不会像人一样打开浏览器、点按钮、读写文件,运行程序。它干的事,本质上还是吐字。
你看到的「调用搜索」「读文件」「发消息」,真实流程大致是这样:

-
你发需求(自然语言)
-
模型根据训练 + 系统提示,决定要不要用某个工具——注意,这一步它只是输出一段结构化文本(比如 JSON:
{"tool": "read_file", "args": {"path": "..."}}),并不是真的去执行 -
外面的程序(Runtime / Agent 框架) 解析这段输出,替你真正调 API、读磁盘、跑命令
-
执行结果再塞回对话,模型根据结果继续想下一步
-
需要就循环——看起来像「自己规划、自己纠错」,其实是「想一步 → 外部干一步 → 再想一步」
打个比方:模型像一位只坐在办公室里的项目经理,口头上派活——「去查一下航班」「把第三段改短一点」;真正跑腿的是楼下那一排工具执行器。项目经理看不见真实世界,只能根据下属递回来的小纸条(工具返回结果)再决定下一步。
所以 OpenClaw、Claude Code 这类东西,厉害的不只是模型,更是外面那层「手脚」:权限、沙箱、重试、多轮编排、接微信/邮件/浏览器……模型负责想,框架负责做。OpenClaw 把这套接力赛做成了普通人也能用的产品,这才是它出圈的关键。
为什么你会觉得它「成精了」?
几个错觉叠加,效果就很唬人:
-
多轮自动循环:你不用每次点「继续」,框架帮你把 tool 结果喂回去,看起来像自主思考
-
工具描述写得好:每个工具都有清晰说明,模型更容易选对、填对参数
-
长上下文 + 记忆:OpenClaw 强调的持久记忆,让前后任务能串起来,不像一次性聊天
-
模型变强了:推理和遵循 JSON 格式的能力上来,少了很多「胡编一个工具名」的尴尬
但边界也在:工具列表外的活,它照样干不了;参数填错、权限不够,照样翻车;敏感操作若没人把关,风险是真实存在的
OpenClaw 爆火,从养虾到后面的养马,说明大家要的从来不是「更会聊天的机器人」,而是能托付一件完整小事的执行者。这件事方向没错。
只是别被「自主 Agent」四个字唬住。拆开看:大脑是大模型,手脚是工程;魔法在编排。
你若也想玩,不妨先搞懂三件事:它接了哪些工具、数据出不出本机、关键操作要不要你点个头。搞懂了,用得踏实;搞不懂,再强的龙虾也只是个会乱点的自动化脚本。
做产品、写代码的朋友尤其该记住:护城河在编排与工具生态,不在于多背两句 prompt。
我还会继续用,在实践中去理解AI在做什么,应该怎么和它交互协作。
夜雨聆风