搞懂AI Agent,先把这13个词吃透

搞懂AI Agent，先把这13个词吃透

上周有个朋友问我：Codex 和 WorkBuddy 有啥区别，一个是模型一个是工具平台？我说不对，这俩都是 Agent 产品，底层跑的才是模型。他说"Agent是什么"。

我想了想，决定写这篇文章。不是因为这些概念有多难，而是这一行的人说话太喜欢堆术语——Token、RAG、MCP、SDD、Harness……每个词单独解释都能写一篇，但要说清楚它们之间是什么关系，就没那么多人说了。

这篇文章只做一件事：把 AI Agent 世界里最核心的13个词，用我自己能理解的方式讲一遍。

1. Agent：不只是聊天机器人

先说最重要的这个词。

很多人把 Agent 理解成"更聪明的 ChatGPT"，这个理解不准确。普通的 ChatGPT 问一句答一句，你不追问它不主动，它的任务就是"生成下一段文字"。

Agent 不是这样运作的。Agent 是以大模型为核心，能自主拆解任务、循环执行、感知反馈、持续推进直到任务完成的东西。关键词是"自主"和"循环"。

举个例子：你让 ChatGPT "帮我查一下竞争对手最近的动态"，它会告诉你"我没有联网能力，无法实时搜索"。你让一个 Agent 做同样的事，它会自己想：我需要搜索工具 → 调用搜索 → 拿到结果 → 整理 → 判断够不够 → 继续补充 → 输出报告。整个过程它自己跑完，不需要你在中间催它。

这背后靠的是三个能力：规划（Planning）——把大任务拆成小步骤；记忆（Memory）——记住过程中积累的信息；工具调用（Tool Use）——搜索、写文件、执行代码等。三件事缺一个，就不能叫 Agent。

2. Token：模型看到的"字"不是字

理解了 Agent，来说底层的东西。

大模型不认识文字，只认识数字。所以所有输入进去的东西——你的问题、上传的文档、系统 prompt——都要先被切成一段一段的"词元"，每个词元对应一个数字 ID，这个过程叫分词（Tokenize），切出来的每一块叫 Token。

中文的一个字大约是 1-2 个 Token，英文一个单词大约 1-3 个 Token（视长度而定）。这就是为什么你会看到各家模型宣传"支持 128k 上下文"——这里的 k 就是 Token 数量，不是字数，换算成中文大概是 6-7 万汉字左右。

Token 直接决定两件事：能装多少信息（上下文窗口限制），以及要花多少钱（按 Token 计费）。你用 WorkBuddy 跑一个复杂任务消耗掉大量积分，背后就是 Token 在烧。

3. 预训练：模型是怎么"出生"的

新的大模型发布时，你会看到"在 XX 亿 Token 数据上训练"这类说法，说的就是预训练。

预训练的逻辑很简单：把大量文本喂给模型，训练它"预测下一个 Token 是什么"。听起来很基础，但做到极致之后，模型就学会了语言规律、事实知识、推理方式——因为要能准确预测"下一个词"，就必须真的理解上文在说什么。

预训练是在海量通用数据（网页、书籍、代码等）上做的，时间长、算力贵，动辄跑几个月。训练完产出的叫"基座模型"，还不能直接用——它知道怎么说话，但不知道怎么"听话"（按指令执行）。

4. 微调：让基座模型"懂规矩"

基座模型有了，但你直接问它"帮我写封邮件"，它可能给你输出一堆不相关的文字续写，因为它只学过"预测下一个词"，没学过"听从指令"。

这时候就需要微调（Fine-tuning）。用更小量、更贴近目标任务的数据，在基座模型上继续训练，让它学会"按照用户意图回答"。常见的方法有监督微调（SFT）和指令微调。

你平时用到的 Claude、GPT、DeepSeek 这些，都是经过微调才变成能对话、能指令跟随的产品。微调数据的质量直接影响模型的"性格"——这也是为什么同一个基座，不同公司微调出来的产品体验差别很大。

5. 幻觉：模型在撒谎但它不知道

这个概念没有图，但很重要。

大模型有时候会说错的事情说得像真的一样，连它自己都不知道这是错的。这叫"幻觉（Hallucination）"。

为什么会这样？因为模型的本质是在做"下一个 Token 概率预测"，它生成的每个词都是"在这个上下文里最可能出现的词"，但"最可能"不等于"最准确"。模型没有事实核查机制，如果训练数据里有错误信息，或者遇到自己没学过的领域，它会继续顺着上下文往下说——说着说着就偏离事实了。

实际使用的影响：不要把大模型当成百科全书用，尤其是需要准确数字、日期、专有名词的场合。让它做推理、写作、代码生成这类任务表现好，让它查具体事实要小心。

6. RAG：给模型装上"查资料"的能力

幻觉问题的一个主要解法是 RAG。

RAG（检索增强生成）的思路是：与其让模型靠"记忆"回答问题，不如在它回答之前，先去相关知识库里检索出最相关的内容，然后把这些内容塞进上下文，让模型"开卷考试"。

举个实际场景：公司内部有几千份产品文档，你想让 Agent 回答用户关于产品的问题。不可能把几千份文档全塞进上下文（Token 撑不住），也不可能靠微调（随时更新的内容没法频繁微调）。RAG 的做法是：用户问问题 → 系统从文档库里找最相关的几段 → 把这几段 + 用户问题一起送给模型 → 模型基于这些内容回答。

这是目前企业 AI 应用里最常见的架构之一，ima 知识库这类产品背后跑的就是这套逻辑。

7. 记忆模块：Agent 怎么"记住"你

一个真正能干活的 Agent，需要记住两类事：

短期记忆：当前这次对话里发生了什么。比如你刚说了"我要写一篇关于 AI 编程工具的文章"，后面说"帮我写第三节"，它要知道第三节是什么意思。实现方式是把对话历史放在上下文里，但 Token 有上限，所以要用截断或摘要的方式控制长度。

长期记忆：跨会话、跨天的信息。你上周告诉 Agent 你喜欢简洁的写作风格，这周开新对话它还能记住。实现方式通常是向量数据库——把历史信息向量化存储，需要时检索最相关的片段放回上下文。

WorkBuddy 的 MEMORY.md 文件、workspace 的日志系统，本质上都是在做长期记忆管理。模型每次读这些文件，就是在"想起"之前记过的东西。

8. MCP：AI 的"Type-C 接口"

接下来这个词现在很火：MCP（Model Context Protocol，模型上下文协议）。

以前 AI 应用要接外部工具——搜索引擎、文件系统、数据库、API——每个工具都要单独写集成代码，接一个搞一套，维护成本高且难以复用。

MCP 做的事是标准化这个接口：制定一套通用协议，工具提供方按照这个协议暴露能力，AI 应用按照这个协议调用，双方不需要了解彼此的内部实现。

就像 Type-C 接口出来之前，手机充电器五花八门；Type-C 普及之后，一根线走天下。MCP 想做的是 AI 工具调用领域的 Type-C。

WorkBuddy 右上角能接各种 MCP 服务器（腾讯文档、飞书、数据库等），背后就是这套协议在跑。

9. Skill：封装起来的"专项能力"

Skill 这个概念在 WorkBuddy 里就是你每天在用的东西，所以我用自己的理解说一下。

Skill 本质上是结构化的本地文件夹，里面放着：告诉模型"这个场景怎么干"的说明文件（skill.md）、相关的规则和流程文档、脚本工具、示例模板。当 Agent 处理相关任务时，会自动加载这个 Skill，等于给它临时装了一套专业知识和工具箱。

和 MCP 的区别：MCP 解决的是"如何调用外部服务"，Skill 解决的是"如何在特定场景下表现得更专业"。微信公众号工具包是个 Skill，不是 MCP，它装的是流程知识（怎么搜文章、怎么改写、怎么发布）和脚本工具，而不是一个标准化接口。

10. ReAct：推理和行动交替进行

Agent 在做复杂任务时，内部是怎么运转的？ReAct（Reason + Act）描述的就是这个过程。

简单说：先推理，判断要做什么 → 执行一个动作（调工具、搜索、写代码）→ 拿到结果 → 再推理，判断下一步 → 再行动……循环直到完成。

对比一下没有 ReAct 的早期 Agent：它会一次性生成一个"行动计划"然后执行，中间出错了也不会调整。ReAct 的每步都在观察结果再决定下一步，更像人类处理问题的方式——先试一下，看看结果，再决定接下来怎么干。

你让 WorkBuddy 发一篇公众号文章，它先查 IP 白名单 → 发现 IP 变了 → 报告需要更新白名单 → 等你确认 → 继续上传图片 → 构建 HTML → 发布。这个来回确认、感知反馈、调整步骤的过程，就是 ReAct 在工作。

11. Agent 的自我反思：做完还要再查一遍

ReAct 让 Agent 在执行过程中动态调整，自我反思（Self-reflection）解决的是"做完怎么检查"的问题。

两种形式：

自我反馈：模型自己审查自己的输出。比如生成了一篇文章，再让它检查"有没有遗漏重要信息"、"有没有违反给定约束"。适合文案审查、格式校验这类任务。

外部反馈：把输出放进真实环境里验证。比如生成了代码，实际运行一下看报不报错；生成了 JSON，用解析器验证一下格式。这种反馈比模型自己审查可靠得多，因为是用事实说话。

高质量的 Agent 系统，通常把这两种都加进去——先自检，再外部验证，哪一步失败就回去修。

12. Harness 工程：给 Agent 设计工作环境

Harness Engineering（驾驭工程）是最近两年才被系统化讨论的概念，说的是给 AI Agent 设计工作环境这件事。

具体包括：上下文管理（给 Agent 看什么信息）、工具调用（Agent 能用哪些工具）、沙箱环境（在哪里执行代码）、权限控制（能不能删文件、能不能发邮件）、测试验证、日志观测、评审机制、反馈回路。

为什么这件事重要？因为 Agent 越来越自主之后，"它能做什么"和"它被允许做什么"是两回事。权限没控制好，Agent 一路往前跑，可能把你不该删的文件删了，或者发出去不该发的消息。Harness 工程就是在搭这个围栏。

WorkBuddy 里发布文章时先停下来确认 IP、等用户手动更新白名单再继续，就是一种权限控制设计——这个动作涉及外部系统（微信公众号），Agent 不应该自己偷偷绕过。

13. SDD：先写规格，再让 AI 动手

最后说 SDD（Spec-Driven Development，规格驱动开发），这是一个工程方法论，但用好了能解决 AI 写代码经常遇到的问题。

常见场景：你让 Agent 改一个功能，它改完你发现它顺手把旁边三个不相关的东西也动了，或者实现方向完全不是你想要的。根源在于需求没说清楚——"把登录页改成支持手机号"这句话，Agent 可以理解成十种不同的实现方式。

SDD 的解法是：在写代码之前，先把需求、范围、系统行为、设计约束、任务拆分通过文档写清楚，让 AI 按照这份规格文档开发，而不是让它自己猜需求。

从结果上看：有规格文档，Agent 偏差少、改动范围可控；没有规格文档，Agent 越是"聪明"越容易自作主张。这个经验做了几个月 AI 开发之后都会有感触。

最后

这 13 个概念，串起来就是一条线：

大模型（预训练 + 微调） 是核心引擎 → Token 是它处理信息的基本单位 → 幻觉是它的先天局限 → RAG 是补这个局限的主要手段 → 记忆模块 让它跨时间积累信息 → MCP 让它接入外部世界 → Skill 让它在专项任务上更专业 → ReAct 是它执行任务的基本循环 → 自我反思 是它自我校验的机制 → 把这些放到工程里，就需要 Harness 工程来管控 → 具体到代码开发，SDD 是减少偏差的方法论 → 以上这些加在一起，构成了你每天在用的 Agent。

不是每个概念都需要深入研究，但知道它们在哪层、解决什么问题，遇到问题时就不会在错误的地方找解法。