OpenClaw和Claude Code让我重新理解了大模型的手脚(Tool Use)-夜雨聆风

OpenClaw和Claude Code让我重新理解了大模型的手脚(Tool Use)

年初 OpenClaw 的刷屏，火得有点离谱——各种晒单：自动清邮箱、跑周报、订机票、在飞书里指挥一排 Agent 协同干活。看得人心里痒痒的，大模型终于不只会聊天，而是有手有脚，真能替你干事了。

我兴冲冲装了一版，体验确实惊艳：你说一句「帮我把这周会议纪要整理成待办」，它真的会去翻文件、列清单、甚至改日历。那种「有个靠谱助理」的感觉，是以前AI纯问答给不了的。

但兴奋过后，我总会多问一句：它到底是怎么「动手」的？模型自己真的会调 API ，使用各种工具吗？

我问了DeepSeek ，结论可能有点扫兴。

模型并没有真的「伸手」

大模型不会像人一样打开浏览器、点按钮、读写文件，运行程序。它干的事，本质上还是吐字。

你看到的「调用搜索」「读文件」「发消息」，真实流程大致是这样：

你发需求（自然语言）
模型根据训练 + 系统提示，决定要不要用某个工具——注意，这一步它只是输出一段结构化文本（比如 JSON：{"tool": "read_file", "args": {"path": "..."}}），并不是真的去执行
外面的程序（Runtime / Agent 框架） 解析这段输出，替你真正调 API、读磁盘、跑命令
执行结果再塞回对话，模型根据结果继续想下一步
需要就循环——看起来像「自己规划、自己纠错」，其实是「想一步 → 外部干一步 → 再想一步」

打个比方：模型像一位只坐在办公室里的项目经理，口头上派活——「去查一下航班」「把第三段改短一点」；真正跑腿的是楼下那一排工具执行器。项目经理看不见真实世界，只能根据下属递回来的小纸条（工具返回结果）再决定下一步。

所以 OpenClaw、Claude Code 这类东西，厉害的不只是模型，更是外面那层「手脚」：权限、沙箱、重试、多轮编排、接微信/邮件/浏览器……模型负责想，框架负责做。OpenClaw 把这套接力赛做成了普通人也能用的产品，这才是它出圈的关键。

几个错觉叠加，效果就很唬人：

但边界也在：工具列表外的活，它照样干不了；参数填错、权限不够，照样翻车；敏感操作若没人把关，风险是真实存在的

OpenClaw 爆火，从养虾到后面的养马，说明大家要的从来不是「更会聊天的机器人」，而是能托付一件完整小事的执行者。这件事方向没错。

只是别被「自主 Agent」四个字唬住。拆开看：大脑是大模型，手脚是工程；魔法在编排。

你若也想玩，不妨先搞懂三件事：它接了哪些工具、数据出不出本机、关键操作要不要你点个头。搞懂了，用得踏实；搞不懂，再强的龙虾也只是个会乱点的自动化脚本。

做产品、写代码的朋友尤其该记住：护城河在编排与工具生态，不在于多背两句 prompt。

我还会继续用，在实践中去理解AI在做什么，应该怎么和它交互协作。

欢迎和我交流。