乐于分享
好东西不私藏

OpenClaw(clawdbot)是什么?跟Skills/MCP/RAG/Memory/AI Agent有什么关系?

OpenClaw(clawdbot)是什么?跟Skills/MCP/RAG/Memory/AI Agent有什么关系?

八股文学习网站:https://interviewguide.cn
前段时间爆火的OpenClaw,具象化体现了什么叫程序员最头疼的事情就是命名。

短短几天时间内,它就已经改了两次名。。。

它的本质是什么?跟大模型和前段时间很火的skills, RAG, mcp, memory 又有什么关系?

接下来我们就一次性将这些概念串起来带大家看清楚,来一波技术祛魅。看之前,你点赞了吗?关注了吗?谢谢!

推理服务是什么

像chatgpt, deepseek这类大模型,本质上就是个超大文件,

gpt-4.bin, deepseek-v3.bin

它躺在磁盘上。文件里装的就是训练时学到的知识参数。

大模型的本质

要让它工作,得有个程序把它加载到内存里,对外暴露HTTP接口,

接收用户请求,做推理,返回结果。这就是推理服务。给它配个前端网页聊天框,就成了我们熟悉的聊天AI。

推理服务是什么

Memory 是什么

推理服务本质是个 HTTP 服务,每个请求进来,处理完就结束,本身不保存任何状态。而且为了扛住高并发,一般会部署多个推理服务实例做负载均衡。你第一次请求可能打到机器 A,第二次请求可能打到机器 B,完全是两个不同的进程。

推理服务是无状态服务

但问题来了,我们在AI聊天页面里,明显感觉它能”记得”我们之前的对话。这是怎么做到的?

其实大模型本身什么都不记得。每次请求时,系统会把之前的聊天记录重新拼到对话里,一起发给大模型。这些拼起来发给大模型的内容,统称上下文。大模型看到完整上下文,自然就能接上话了。

上下文是什么

但问题又来了,如果每次请求都把所有历史对话发出去,上下文会超长,大模型处理不了。怎么办呢? 我们可以分两类管理:当前会话最近几轮对话完整保存,这叫短期记忆。很久之前的对话提取关键信息压缩成摘要,这叫长期记忆

长期记忆和短期记忆

每次请求时,都将它们拼进对话,发给大模型。这样大模型看起来就像有记忆一样。

这套管理上下文的机制,就叫 Memory

Memory是什么

RAG 是什么

有了记忆,大模型能记住历史对话了。但新问题又来了,大模型的训练数据,都是从互联网上抓的历史公开数据,训练完成后知识就固定了。你问它今天的新闻或公司内部文档,它根本不可能知道。

怎么办?给它配个外部知识库,里面可以放最新新闻、公司内部文档这些资料,数据量大的话,就存到数据库里。

用户提问时,先从数据库里做匹配,获得相关知识,再一起喂给大模型。大模型就能基于这些外部知识回答。这种”检索外部知识给到大模型做回答”的方案,就是检索增强生成,Retrieval-Augmented Generation,简称RAG。

RAG是什么

但问题又来了,传统数据库只能做字面匹配,但”黄枫谷历飞羽”和”韩老魔”虽然意思一样,字面却完全不同,匹配不到。怎么办呢?我们可以把文本转成向量,用向量距离衡量语义相似度。

语义匹配

这样语义相近的文本就能匹配上了。所以RAG用的数据库里存的是向量数据,这种数据库也叫向量数据库,比如 Milvus , 数据量不大的话,也可以用我们的老朋友PostgreSQL。

向量数据库

MCP 是什么

有了memory和RAG的加持,大模型能记住历史聊天和获取外部知识了。但新问题又来了,现在大模型只能对话和思考,就像缸中大脑,没有手脚。怎么让它具备操作工具的能力呢?

好办,我们可以在对话里约定一种消息格式。外部先告诉大模型有哪些工具可用,格式像这样:

有哪些tool

大模型想用工具时,输出一段特定格式JSON, 比如发邮件,里面写清楚要发给谁和发什么。

大模型想用工具时输出特定格式Json

外部收到消息后,执行发送邮件,完成后,将返回的结果再喂回给大模型。

大模型就能基于工具执行结果,生成最终回复

这种大模型和外部程序之间通过特定格式,来表达工具调用意图的机制,被称为 Function Calling;而外部程序根据这一意图与工具插件交互的协议,则被称为 Model Context Protocol,简称 MCP。这个在外部负责解析JSON 并操作工具的程序叫 MCP Host,比如我们用来写代码的cursor, claude code。

能被调用的具体工具,就叫 MCP 插件,也就是MCP Server。MCP 插件可以部署在本地电脑,也可以在远端服务器上。MCP Host上专门负责跟MCP server通信的组件,叫MCP Client比如 GitHub MCP 插件,本地MCP Host上的 MCP Client 负责接收调用请求,远端的 MCP Server 部署在 GitHub 服务器上,真正执行 GitHub API 操作。

MCP相关概念

Skills 是什么

MCP协议和插件解决了工具调用问题,但新问题又来了,这么多插件,大模型怎么知道该按什么顺序用、怎么组合用呢?

这就好比给了一个大学生一堆钳子、扳手,他也不一定能修好车。他缺的是经验流程

那好办,我们可以写一份”操作手册”,里面详细说明遇到什么场景用什么工具、先做什么后做什么、有什么注意事项。这份结构化的操作指南,就叫Skills

Skills是什么

以排查线上事故为例,MCP 只是把「查监控、查日志、查配置、回滚版本」这些工具能力给到大模型; 而排查问题 Skills 则明确规定了先看监控判断影响范围 → 再查日志和配置定位模块 → 必要时执行回滚 这一整套固定流程。

换句话说,大模型就像大脑,MCP 协议让它有了手,mcp插件就是手上的工具;而 Skills 是操作经验,规定在什么场景下、按什么顺序、组合使用哪些工具。

MCP和SKills的关系

AI Agent 是什么

大模型本来就能思考和规划,给它加上了Memory让它能记住历史,加上RAG让它能获取外部知识,加上MCP和Skills让它能操作工具。它们共同构成了一个在某些功能上能代替人类,自主行动完成目标的AI系统,又叫 AI Agent。它本质上就是一个智能工具人。通过提示词设定角色, 它可以是智能客服、程序员、私人律师等各种角色, 听从你的指令完成任务。

ai agent是什么

最近很火的OpenClaw,其实本质上就是个帮你自动操作电脑的ai agent,你能用电脑干什么,它就能干什么,比如发邮件,投简历,甚至做交易,所以权限安全是个大问题。客观的说,OpenClaw做的事情并没有技术上的突破,它跟前段时间很火的manus其实是类似的产品。只不过OpenClaw主要面向本地电脑,manus考虑到安全问题,将操作环境放在远端虚拟机里。如果将OpenClaw部署到远端服务器上,就有点”开源版的manus”那味道了。

OpenClaw类似于本地版的manus

安不安全是用户该考虑的问题,OpenClaw只管开源,有一种野路子的美,所以最近火得一塌糊涂。建议大家还是理性看待,先想清楚到底有什么工作是需要它做的再说吧。

现在大家通了吗?

好啦,如果你觉得这期视频对你有帮助,记得转发给你那不成器的兄弟。

最后遗留一个问题,单个agent你了解了,那你知道多个agent是怎么互相协作的吗?多agent都有哪些架构。

好文推荐

C++ 训练营,来了!

Java/Golang后端训练营,主打一个突击!

阿秀去面腾讯了(社招两年面试经验)

没想到,百度的市值已经连腾讯音乐都不如了。。。

你好,我是阿秀,普通学校毕业,校招时拿到字节跳动SP、百度、华为、农业银行等6个互联网中大厂offer,这是我在校期间的编程学习之路,点击蓝字即可查看我是如何自学技术以应对第二年的校招的全过程。

毕业后我先于抖音部门担任全栈开发工程师,目前在上海某外企带领团队继续从事全栈开发,负责的项目已经顺利盈利300w+。在研三那年就组建了一个阿秀的学习圈,持续分享校招/社招跳槽找工作的经验,目前已经累计服务22、23、24、25、26、27届同学,共计超过 4500 +人,欢迎点此🔗加入我们,一群人才能走的更远、更稳、更顺。