很多人都觉得 AI Agent 无非就是给大模型套个对话界面而已。真正动手落地才明白,决定系统好坏的关键,往往不是模型本身有多强,而是提示词工程、知识检索、工具调用、运行状态、任务调度和外部对接这些底层能力。
最近研究 AI Agent 的朋友,肯定经常碰到这些名词:Prompt、RAG、Fine-tuning、Tool Call、状态机、Workflow、MCP。它们全都和 Agent 相关,但又处在完全不同的层级。大家最大的困惑从来不是写代码,而是:这些技术到底在解决什么问题?各自的边界在哪?实际做项目时该怎么搭配使用?
今天我就把这些概念全部放进同一张架构图里,一次性给你讲明白,帮你建立一套能直接指导实际开发的完整认知体系。
想快速抓住核心的朋友,先记住这 7 句话:
• Prompt 就是给模型下达本次任务的具体指令
• RAG 就是为模型临时补充答题需要的参考资料
• Fine-tuning 就是让模型形成稳定的行为习惯
• Tool Call 就是让模型从只会说话变成能办实事
• 状态机就是记录 Agent 目前执行到哪个环节
• Workflow 就是规划任务后续的完整执行路径
• MCP 就是让各类工具资源用标准方式接入系统
你会发现,这些概念之间不是谁替代谁,而是各司其职、相互配合。
从标准的 AI Agent 能力分层来看,我们能得出一个关键结论:Prompt 是任务的起点,RAG 负责知识补给,Tool Call 赋予行动能力,Workflow 处理多步调度,状态机保障运行可控,MCP 实现外部能力标准化接入,而微调则作用于模型本身,用来提升长期表现的稳定性。
一、Prompt:不是终点,而是起点
很多人以为 Prompt 就是简单提个问题,其实在真实的 Agent 系统里,它是一份动态组装的完整任务执行手册。通常包含这些部分:系统提示词定义角色目标和边界、开发者提示词设置底层约束、用户提示词承载当前需求、对话上下文记录历史交互、检索上下文提供参考资料、工具返回结果、输出格式规范。
说白了,Prompt 的本质不是一句提问,而是给模型的完整任务说明书。它主要管三件事:定身份——你是什么角色;定目标——你现在要完成什么;定规则——什么能做什么绝对不能做。
Prompt 的好处非常明显:入门快、成本低、迭代灵活,特别适合做最小验证和规则经常变动的场景。但它也有天生的局限:上下文太长时规则容易被冲淡,约束多了容易产生冲突,稳定性肯定不如训练出来的能力,复杂系统绝不能只靠 Prompt 硬扛。
记住一个实用原则:Prompt 适合做快速调控,不适合把所有逻辑都硬写在里面。
二、RAG:让模型学会"开卷考试"
RAG 全称 Retrieval-Augmented Generation,也就是检索增强生成。核心逻辑特别好懂:先找资料,再回答问题。换句话说,RAG 不是把知识灌进模型里,而是运行时实时找出相关内容,临时喂给模型参考。
RAG 最擅长处理这类问题:模型本来不知道的、模型知道但说得不准的、知识更新很频繁的、需要提供来源依据的。典型应用场景包括:企业内部规章查询、产品使用手册问答、开发文档检索、合同条款核对、运维操作手册查询、内部知识库问答等。
RAG 擅长补知识,但不擅长固化行为模式。比如问公司退款政策适合用 RAG,但要求永远用统一的客服语气回复,就更适合用 Prompt 或者微调。一句话记住:RAG 解决的是模型这次答题需要知道什么。
三、Fine-tuning:把能力刻进模型里
Fine-tuning 就是在现成模型基础上,用特定领域的数据继续训练,让它更擅长某类工作、某种输出风格或者固定任务。打个最形象的比方:Prompt 是考前划重点,RAG 是考试允许翻书,微调就是平时把这类题练到肌肉记忆。
微调最核心的价值不是补知识,而是固化行为模式。典型收益包括:输出格式更稳定统一、说话风格更一致、分类判断更可靠、不用再写超长 Prompt、小模型也能胜任专业工作。
特别适合用微调的任务有:文本分类、意图识别、结构化信息提取、风险内容检测、标准化报告生成。
但这些内容千万别用微调:经常变动的业务规则、刚更新的文档内容、数据库里的实时数据、需要精确查询的外部信息。一句话划清边界:微调解决的是模型长期习惯怎么做,不是这次答题该查什么。
四、Tool Call:让模型从"嘴炮"变"实干"
Tool Call 也叫 Function Calling,本质就是让模型推理时不光输出人话,还能主动请求调用外部功能。
没有 Tool Call,模型最多就是动动嘴:能说会道、能解释、能分析、能给建议。有了 Tool Call,模型才能真正动手干活:查数据库、调业务接口、发邮件、建工单、查订单、控设备、写日志。可以说,Tool Call 是 AI Agent 从陪聊变助理的关键转折点。
真正的难点从来不是能不能调通接口,而是:什么时候该调用、该调用哪一个、参数怎么补全、参数合不合法、调用失败怎么重试、多个工具怎么配合、怎么防止死循环、怎么做权限控制和审计。所以说,Tool Call 很重要,但它不等于完整的 Agent 系统。
五、状态机:让 Agent 运行"看得见摸得着"
一个真正的 Agent 不是永远都在回答问题。它会经历各种中间状态:待命等待、任务规划、工具执行中、等待工具返回、等待用户确认、整理结果、任务完成、执行失败。没有状态机的话,你很快就会遇到这些麻烦:前端没法显示进度、出问题查日志困难、执行路径追踪不了、暂停恢复重试都做不了。
状态机定义的就是:Agent 有哪些状态,以及状态之间怎么切换。它最大的价值就是让 Agent 变得可控可观测:前端能展示真实进度、后端日志好归集、方便追踪和回放、更容易做异常处理和中断恢复。对于要产品化的 Agent,状态机基本是标配。
六、Workflow:让复杂任务按剧本走
Workflow 说白了就是:把复杂任务拆成清晰的多个步骤,定义好每个步骤的输入输出、执行顺序、条件分支和异常处理。
很多人分不清 Workflow 和状态机。区别其实很简单:状态机关心现在在哪,回答"我到哪了";Workflow 关心接下来干啥,回答"下一步怎么走"。打个比方:状态机就像演员当下的状态,Workflow 就像整部戏的剧本流程。两者经常一起出现,但完全是两回事。
为什么生产环境必须要有 Workflow?因为真实业务任务几乎都包含:多步判断、条件分支、工具配合、用户确认、异常兜底、人工介入。没有 Workflow,系统就变成全靠模型自由发挥。做演示可能够了,上生产绝对不行。
七、MCP:统一接入的"通用插座"
MCP 一般指 Model Context Protocol。你可以先把它理解成:一套用来标准化接入各类工具、资源和上下文的协议。它不替代 Tool Call,也不替代模型本身,解决的是更底层的问题:当 Agent 要接的外部能力越来越多,怎么用一套标准方式来对接和管理?
没有统一协议的话,每接一个工具都要单独处理:参数定义、格式说明、调用方式、返回格式、鉴权方式、错误处理、能力暴露。等你要接 GitHub、Jira、数据库、CRM、文档系统、内部接口时,重复开发的成本会越来越高。
MCP 的价值就在于:统一工具暴露方式、统一资源暴露方式、统一格式约束、统一上下文读取、统一能力发现机制。
MCP 和 Tool Call 的区别:Tool Call 在模型执行层,关心现在要不要调、调哪个、参数是什么;MCP 在工具接入层,关心这些工具资源怎么用标准协议暴露出来。再打个比方:Tool Call 就像我要打电话,MCP 就像统一的通讯录、号码规则和拨号标准。两者是协作关系,不是替代关系。
八、看完这个场景,你就全懂了
为了让这些概念更接地气,我们来看一个真实场景。用户对运维 Agent 说:帮我查查昨天生产环境 API 报错率为什么突然飙升。
一套成熟的 Agent 系统通常是这么工作的:
第一步,Prompt 定规则。系统先告诉模型:你是专业运维分析师,绝对不能编造监控数据,必须先查监控再查日志,输出必须包含结论、证据和改进建议。
第二步,Workflow 定流程。工作流提前规划好:识别这是故障分析请求→查询监控平台→查询日志平台→对齐时间窗口→整理证据链→输出结论和建议。
第三步,状态机报进度。整个过程中,Agent 会依次经历规划中、工具执行中、等待返回、总结中、已完成,前端就能把这些状态实时展示给用户。
第四步,Tool Call 干实事。模型会发起查询监控指标、检索错误日志的调用。
第五步,MCP 做对接。如果监控、日志、工单系统都通过 MCP 暴露能力,Agent 的接入和管理成本会低很多。
第六步,RAG 补背景。如果需要参考系统架构图、错误码说明、历史故障记录,就通过 RAG 把这些资料喂给模型。
第七步,微调提稳定。如果这个 Agent 长期要输出固定格式的故障报告,而且公司有统一的术语和风格,微调就能发挥明显作用。
这个例子最能说明:AI Agent 从来不是某一个技术点,而是多个能力模块的协同作战。
九、90%的人都会踩的 6 个坑
做 AI Agent 最容易犯的 6 个错误,一定要避开:
误区 1:把 Prompt 当万能钥匙。Prompt 很重要,但它更像遥控器,不是发动机。规则一多、流程一长,光靠 Prompt 很容易出问题。
误区 2:把 RAG 当训练模型。RAG 不会改模型参数,只是运行时把外部资料临时给模型参考而已。
误区 3:把微调当知识库。如果知识经常更新,优先考虑 RAG、查数据库或者调工具,千万别用微调。
误区 4:把 Tool Call 当接口转发。难点不是能不能调通,而是什么时候调、调什么、调完怎么处理、失败怎么兜底、权限怎么管。
误区 5:把 Workflow 和状态机搞混。Workflow 管步骤怎么走,状态机管现在走到哪。一个管路线,一个管位置。
误区 6:把 MCP 当接口文档。MCP 的价值不只是描述接口,而是让工具资源用统一协议被发现、接入和管理。
十、从 0 到 1,正确的搭建顺序
从零开始做 AI Agent,建议按这个顺序来:
第一阶段:先跑通 Prompt。先验证两件事:这个任务到底适不适合用大模型,模型能不能在 Prompt 引导下完成基础能力。这一步不是做完整系统,而是快速验证价值。
第二阶段:加上 RAG。如果业务依赖私有知识、规则手册、产品文档,尽早引入 RAG,让回答更准确、可追溯。
第三阶段:接入 Tool Call。如果任务不只是问答,还要查数据、改状态、连系统,Tool Call 很快就会成为核心能力。
第四阶段:加入状态机和 Workflow。当系统进入多步执行、长链路任务、需要展示中间状态时,这两个就从可选项变成必需品。
第五阶段:再考虑微调。遇到这些问题时再认真考虑微调:Prompt 越写越长、示例越堆越多、输出风格不稳定、高并发成本压力大、想让小模型干专业活、已经攒够高质量样本。
第六阶段:平台化时上 MCP。当你的 Agent 开始接越来越多外部系统、给多个业务团队复用、需要统一工具管理时,MCP 的价值才会真正体现。
最后总结
AI Agent 真不是给大模型套层壳,而是一整套围绕理解、检索、调用、调度、执行和治理的系统能力组合。真正重要的不是背术语,而是想明白三件事:每个技术解决什么问题、各自的边界在哪、你的业务到底需要哪几层能力。把这张能力地图看清楚了,再做架构设计、技术选型和工程落地,很多问题都会迎刃而解。
一句话速记版
• Prompt:告诉模型这次具体该怎么做
• RAG:给模型补充本次答题的参考资料
• Fine-tuning:让模型形成稳定的行为习惯
• Tool Call:让模型能调用外部工具办实事
• 状态机:记录 Agent 当前运行到哪个阶段
• Workflow:规划任务后续的完整执行路径
• MCP:统一各类工具资源的接入标准协议
夜雨聆风