搞懂AI Agent,先把这13个词吃透

上周有个朋友问我:Codex 和 WorkBuddy 有啥区别,一个是模型一个是工具平台?我说不对,这俩都是 Agent 产品,底层跑的才是模型。他说"Agent是什么"。
我想了想,决定写这篇文章。不是因为这些概念有多难,而是这一行的人说话太喜欢堆术语——Token、RAG、MCP、SDD、Harness……每个词单独解释都能写一篇,但要说清楚它们之间是什么关系,就没那么多人说了。
这篇文章只做一件事:把 AI Agent 世界里最核心的13个词,用我自己能理解的方式讲一遍。
1. Agent:不只是聊天机器人
先说最重要的这个词。
很多人把 Agent 理解成"更聪明的 ChatGPT",这个理解不准确。普通的 ChatGPT 问一句答一句,你不追问它不主动,它的任务就是"生成下一段文字"。
Agent 不是这样运作的。Agent 是以大模型为核心,能自主拆解任务、循环执行、感知反馈、持续推进直到任务完成的东西。关键词是"自主"和"循环"。
举个例子:你让 ChatGPT "帮我查一下竞争对手最近的动态",它会告诉你"我没有联网能力,无法实时搜索"。你让一个 Agent 做同样的事,它会自己想:我需要搜索工具 → 调用搜索 → 拿到结果 → 整理 → 判断够不够 → 继续补充 → 输出报告。整个过程它自己跑完,不需要你在中间催它。
这背后靠的是三个能力:规划(Planning)——把大任务拆成小步骤;记忆(Memory)——记住过程中积累的信息;工具调用(Tool Use)——搜索、写文件、执行代码等。三件事缺一个,就不能叫 Agent。
2. Token:模型看到的"字"不是字
理解了 Agent,来说底层的东西。
大模型不认识文字,只认识数字。所以所有输入进去的东西——你的问题、上传的文档、系统 prompt——都要先被切成一段一段的"词元",每个词元对应一个数字 ID,这个过程叫分词(Tokenize),切出来的每一块叫 Token。
中文的一个字大约是 1-2 个 Token,英文一个单词大约 1-3 个 Token(视长度而定)。这就是为什么你会看到各家模型宣传"支持 128k 上下文"——这里的 k 就是 Token 数量,不是字数,换算成中文大概是 6-7 万汉字左右。
Token 直接决定两件事:能装多少信息(上下文窗口限制),以及要花多少钱(按 Token 计费)。你用 WorkBuddy 跑一个复杂任务消耗掉大量积分,背后就是 Token 在烧。

3. 预训练:模型是怎么"出生"的
新的大模型发布时,你会看到"在 XX 亿 Token 数据上训练"这类说法,说的就是预训练。
预训练的逻辑很简单:把大量文本喂给模型,训练它"预测下一个 Token 是什么"。听起来很基础,但做到极致之后,模型就学会了语言规律、事实知识、推理方式——因为要能准确预测"下一个词",就必须真的理解上文在说什么。
预训练是在海量通用数据(网页、书籍、代码等)上做的,时间长、算力贵,动辄跑几个月。训练完产出的叫"基座模型",还不能直接用——它知道怎么说话,但不知道怎么"听话"(按指令执行)。
4. 微调:让基座模型"懂规矩"
基座模型有了,但你直接问它"帮我写封邮件",它可能给你输出一堆不相关的文字续写,因为它只学过"预测下一个词",没学过"听从指令"。
这时候就需要微调(Fine-tuning)。用更小量、更贴近目标任务的数据,在基座模型上继续训练,让它学会"按照用户意图回答"。常见的方法有监督微调(SFT)和指令微调。
你平时用到的 Claude、GPT、DeepSeek 这些,都是经过微调才变成能对话、能指令跟随的产品。微调数据的质量直接影响模型的"性格"——这也是为什么同一个基座,不同公司微调出来的产品体验差别很大。
5. 幻觉:模型在撒谎但它不知道
这个概念没有图,但很重要。
大模型有时候会说错的事情说得像真的一样,连它自己都不知道这是错的。这叫"幻觉(Hallucination)"。
为什么会这样?因为模型的本质是在做"下一个 Token 概率预测",它生成的每个词都是"在这个上下文里最可能出现的词",但"最可能"不等于"最准确"。模型没有事实核查机制,如果训练数据里有错误信息,或者遇到自己没学过的领域,它会继续顺着上下文往下说——说着说着就偏离事实了。
实际使用的影响:不要把大模型当成百科全书用,尤其是需要准确数字、日期、专有名词的场合。让它做推理、写作、代码生成这类任务表现好,让它查具体事实要小心。
6. RAG:给模型装上"查资料"的能力
幻觉问题的一个主要解法是 RAG。
RAG(检索增强生成)的思路是:与其让模型靠"记忆"回答问题,不如在它回答之前,先去相关知识库里检索出最相关的内容,然后把这些内容塞进上下文,让模型"开卷考试"。
举个实际场景:公司内部有几千份产品文档,你想让 Agent 回答用户关于产品的问题。不可能把几千份文档全塞进上下文(Token 撑不住),也不可能靠微调(随时更新的内容没法频繁微调)。RAG 的做法是:用户问问题 → 系统从文档库里找最相关的几段 → 把这几段 + 用户问题一起送给模型 → 模型基于这些内容回答。
这是目前企业 AI 应用里最常见的架构之一,ima 知识库这类产品背后跑的就是这套逻辑。

7. 记忆模块:Agent 怎么"记住"你
一个真正能干活的 Agent,需要记住两类事:
短期记忆:当前这次对话里发生了什么。比如你刚说了"我要写一篇关于 AI 编程工具的文章",后面说"帮我写第三节",它要知道第三节是什么意思。实现方式是把对话历史放在上下文里,但 Token 有上限,所以要用截断或摘要的方式控制长度。
长期记忆:跨会话、跨天的信息。你上周告诉 Agent 你喜欢简洁的写作风格,这周开新对话它还能记住。实现方式通常是向量数据库——把历史信息向量化存储,需要时检索最相关的片段放回上下文。
WorkBuddy 的 MEMORY.md 文件、workspace 的日志系统,本质上都是在做长期记忆管理。模型每次读这些文件,就是在"想起"之前记过的东西。
8. MCP:AI 的"Type-C 接口"
接下来这个词现在很火:MCP(Model Context Protocol,模型上下文协议)。
以前 AI 应用要接外部工具——搜索引擎、文件系统、数据库、API——每个工具都要单独写集成代码,接一个搞一套,维护成本高且难以复用。
MCP 做的事是标准化这个接口:制定一套通用协议,工具提供方按照这个协议暴露能力,AI 应用按照这个协议调用,双方不需要了解彼此的内部实现。
就像 Type-C 接口出来之前,手机充电器五花八门;Type-C 普及之后,一根线走天下。MCP 想做的是 AI 工具调用领域的 Type-C。
WorkBuddy 右上角能接各种 MCP 服务器(腾讯文档、飞书、数据库等),背后就是这套协议在跑。
9. Skill:封装起来的"专项能力"
Skill 这个概念在 WorkBuddy 里就是你每天在用的东西,所以我用自己的理解说一下。
Skill 本质上是结构化的本地文件夹,里面放着:告诉模型"这个场景怎么干"的说明文件(skill.md)、相关的规则和流程文档、脚本工具、示例模板。当 Agent 处理相关任务时,会自动加载这个 Skill,等于给它临时装了一套专业知识和工具箱。
和 MCP 的区别:MCP 解决的是"如何调用外部服务",Skill 解决的是"如何在特定场景下表现得更专业"。微信公众号工具包是个 Skill,不是 MCP,它装的是流程知识(怎么搜文章、怎么改写、怎么发布)和脚本工具,而不是一个标准化接口。
10. ReAct:推理和行动交替进行
Agent 在做复杂任务时,内部是怎么运转的?ReAct(Reason + Act)描述的就是这个过程。
简单说:先推理,判断要做什么 → 执行一个动作(调工具、搜索、写代码)→ 拿到结果 → 再推理,判断下一步 → 再行动……循环直到完成。
对比一下没有 ReAct 的早期 Agent:它会一次性生成一个"行动计划"然后执行,中间出错了也不会调整。ReAct 的每步都在观察结果再决定下一步,更像人类处理问题的方式——先试一下,看看结果,再决定接下来怎么干。
你让 WorkBuddy 发一篇公众号文章,它先查 IP 白名单 → 发现 IP 变了 → 报告需要更新白名单 → 等你确认 → 继续上传图片 → 构建 HTML → 发布。这个来回确认、感知反馈、调整步骤的过程,就是 ReAct 在工作。

11. Agent 的自我反思:做完还要再查一遍
ReAct 让 Agent 在执行过程中动态调整,自我反思(Self-reflection)解决的是"做完怎么检查"的问题。
两种形式:
自我反馈:模型自己审查自己的输出。比如生成了一篇文章,再让它检查"有没有遗漏重要信息"、"有没有违反给定约束"。适合文案审查、格式校验这类任务。
外部反馈:把输出放进真实环境里验证。比如生成了代码,实际运行一下看报不报错;生成了 JSON,用解析器验证一下格式。这种反馈比模型自己审查可靠得多,因为是用事实说话。
高质量的 Agent 系统,通常把这两种都加进去——先自检,再外部验证,哪一步失败就回去修。
12. Harness 工程:给 Agent 设计工作环境
Harness Engineering(驾驭工程)是最近两年才被系统化讨论的概念,说的是给 AI Agent 设计工作环境这件事。
具体包括:上下文管理(给 Agent 看什么信息)、工具调用(Agent 能用哪些工具)、沙箱环境(在哪里执行代码)、权限控制(能不能删文件、能不能发邮件)、测试验证、日志观测、评审机制、反馈回路。
为什么这件事重要?因为 Agent 越来越自主之后,"它能做什么"和"它被允许做什么"是两回事。权限没控制好,Agent 一路往前跑,可能把你不该删的文件删了,或者发出去不该发的消息。Harness 工程就是在搭这个围栏。
WorkBuddy 里发布文章时先停下来确认 IP、等用户手动更新白名单再继续,就是一种权限控制设计——这个动作涉及外部系统(微信公众号),Agent 不应该自己偷偷绕过。
13. SDD:先写规格,再让 AI 动手
最后说 SDD(Spec-Driven Development,规格驱动开发),这是一个工程方法论,但用好了能解决 AI 写代码经常遇到的问题。
常见场景:你让 Agent 改一个功能,它改完你发现它顺手把旁边三个不相关的东西也动了,或者实现方向完全不是你想要的。根源在于需求没说清楚——"把登录页改成支持手机号"这句话,Agent 可以理解成十种不同的实现方式。
SDD 的解法是:在写代码之前,先把需求、范围、系统行为、设计约束、任务拆分通过文档写清楚,让 AI 按照这份规格文档开发,而不是让它自己猜需求。
从结果上看:有规格文档,Agent 偏差少、改动范围可控;没有规格文档,Agent 越是"聪明"越容易自作主张。这个经验做了几个月 AI 开发之后都会有感触。
最后
这 13 个概念,串起来就是一条线:
大模型(预训练 + 微调) 是核心引擎 → Token 是它处理信息的基本单位 → 幻觉 是它的先天局限 → RAG 是补这个局限的主要手段 → 记忆模块 让它跨时间积累信息 → MCP 让它接入外部世界 → Skill 让它在专项任务上更专业 → ReAct 是它执行任务的基本循环 → 自我反思 是它自我校验的机制 → 把这些放到工程里,就需要 Harness 工程来管控 → 具体到代码开发,SDD 是减少偏差的方法论 → 以上这些加在一起,构成了你每天在用的 Agent。
不是每个概念都需要深入研究,但知道它们在哪层、解决什么问题,遇到问题时就不会在错误的地方找解法。

夜雨聆风