拿下大厂AI岗(三):Agent架构进化!一次性讲透 Skills 机制到底牛在哪(附面试八股)-夜雨聆风

拿下大厂AI岗(三):Agent架构进化!一次性讲透 Skills 机制到底牛在哪(附面试八股)

点击蓝字，关注我们

大家好，我是小张。

在前两篇文章中，我们带大家深度剖析了 AI Agent 的底层基石：Tools，以及当下爆火的连接协议：MCP。

但如果你最近在研究微软的 Semantic Kernel、AutoGPT 或者是各种企业级的 Agent 编排平台（如 Coze, Dify），会发现大厂在构建复杂 Agent 时，满嘴跑的都是另一个核心概念：Skills。

很多同学学到这里就懵了：我已经懂了 Tools，也知道了怎么用 MCP 连工具，这个突然冒出来的 Skills 到底是什么？它和前两者有什么关系？

今天我们就来扒一扒 Skill 的底层逻辑究竟是什么？它与 MCP、Tools 到底有什么本质区别？

这篇文章同样将从基础概念、工作机制、核心对比，一直讲到面试高频八股文。全是干货，建议先收藏再看，留着面试前复习！

1 基础概念：什么是 Skill (技能)？

如果我们要把大模型打造成一个超级员工，那么tools,MCP,Skills 在当中发挥的作用则对应如下：

Tools：是起子、扳手、螺丝刀。
MCP：是让各类工具都能插上的“通用插座”。
Skills：则是《如何组装一张宜家桌子的标准作业流程》。

以往，我们给大模型装上 Tools，它知道“我有螺丝刀”。但遇到复杂的业务（比如：先查本周流水，再对比上周，最后画出对比图并发送邮件），大模型往往不知道怎么编排这套复杂的动作，极易产生幻觉瞎调。

Skills 就是对“特定上下文 Prompt + 业务逻辑 + 若干强相关 Tools”的一层高级封装。只要 Agent 触发了这个 Skill，它就瞬间进入了对应场景的“专家模式”，获得这套 SOP，并清楚底下的子工具该怎么配合使用。

一个 Skill 就是一个包含 SKILL.md 文件以及可选脚本或其他资源的文件夹（建议使用子文件夹来组织辅助脚本、模板和数据文件）。下面是一个skill的示例。

在这个图片中，每一部分的内容和功能如下：

SKILL.md是必需的，它skill 的核心文件，包含frontmatter: 里面为name、description，主要告诉LLM 这个 skill 是什么、什么时候触发。正文:具体的工作指令和流程。

scripts文件夹，按需选择，可有可无。主要用来放可执行的脚本文件。skill 执行时可以调用这些脚本来完成具体任务。例如：process.py 用 Python 做代码分析。

references文件夹，按需选择，可有可无。主要用来放静态知识/参考文档。给 skill 提供额外的上下文信息。例如style-guide.md团队的代码风格规范。skill 执行时会读取这些文件作为参考依据，在 SKILL.md 里用 [style-guide](references/style-guide.md) 引用。

assets文件，按需选择，可有可无。放模板、图片等资源文件。比如可放template.docx 提供审查报告的模板,用于生成输出或作为格式参考。

2 核心进阶：“渐进式披露”机制

如果只是简单的把工具封装成 Skills，随着数量的增多，必定会面临一个极其现实的工程问题：每个 Skill 下面还有十几个具体的 Tools 参数说明。由于 Token 限制，不可能在系统初始 Prompt 里把它们全塞给大模型。

而Skills的设计者更早想到了这个问题，并提供了解决方案——渐进式披露。通俗来说，就是“你看一层，我给你看下一层，绝不一次性填鸭”。

在复杂 Agent中，渐进式披露是这样工作的：

第一层：目录级披露。初始上下文里，系统只向大模型披露一个包含各个 Skill 粗略描述或分类的列表。大模型分析用户请求，决定调用数据分析 Skill。也就是红线框出的部分，大模型会读取每一个Skill对应的段落，对SKill功能有大致了解。

第二层：按需展开。当模型决定进入数据分析 Skill 后，系统才会动态披露该 Skill 内部的详细细节：专用的 Prompt 引导、底层数据库的 Schema，以及查询SQL_Tool、画折线图_Tool 的详细 API 格式。比如这里需要检查python代码检查，他才会阅读对应的.md文件，否则不会阅读。

第三层：执行与反馈大模型在这个被“聚焦”的局部上下文中完成计算，并将最终结果返回到上一层。

为什么要用渐进式披露？它就像是打开一棵树的节点。通过“由面到点”的层层下钻，极大降低了大模型的认知负荷，彻底避免了“大词典一把梭”导致的 Token 爆炸和幻觉，使得 Agent 的技能库具备了理论上的无限扩展性。

而渐进式披露作为Skills的核心亮点，往往在面试中也是最常问的问题之一。

3 重点考察：Skills, MCP, Tools的本质区别？

从开始投递到现在，也差不多一个月了，历经了数十次面试，不下于两个面试官问到SKills与MCP，tools的本质区别，或者说Skills出现的必要性。这里我们就来总结一下（以下为个人观点，如有错误或偏见欢迎大家在评论区指出）。

Tools：这是最早出现的定义，本质就是function calling。它能够将大模型连接到外部世界，但是不同的LLM接口不同，如果更换LLM则需要重写相关代码，增加了代码量，继而引出了MCP。

MCP：MCP的出现，主要是为了解决tools重写的问题，让不同平台的LLM都能够调用同一个tools减少代码量。但本质上，大模型调用哪个工具还是根据输入+大模型本身的思考，如果大模型思考出错调用错工具会导致整个流程出错。另外，大模型选择工具的时候，需要提前了解每一个tools的基本输入以及功能，当tools增加，他需要了解所有的tools，token量的消耗是极大的。继而引出SKills。

Skills: 我认为可以把SKills理解为专家的经验。当一个流程已经充分的经过前人的验证，每一步需要调用什么tools已经确定，我们把它包装成为Skills那么大模型就不会再出现调用错工具的情况，提高正确率。同样每个Skills会包含若干tools，由于Skills的渐进式披露机制，我们不需要读取所有的tools描述，减少了token消耗。

4 Agent Skills 高频面试八股文

为了帮大家拿下 Offer，这里同样总结了有关 Skills 与整体架构面试中常问的问题，建议背诵！

Q1：什么是 Agent Skills架构中的“渐进式披露”，它解决了什么痛点？

答：这是一种分层按需提供信息的架构模式。解决痛点：当系统拥有海量工具或长文本操作指南时，一次性将所有 API 定义丢给 LLM 会导致 Token 超限、推理变慢并极易诱发幻觉。通过渐进式披露，模型首先只能看到Skill的摘要。等它明确意图并做出初步选择后，系统再将选中的 Skill 内部具体的工具细节暴露到当前上下文中，以此实现认知聚焦。

Q2：Skills 和 Tool 的本质区别是什么？为什么不能只用 Tool？

Skills 是对一组相关 Tool 的逻辑封装，附带描述、使用场景和编排逻辑；Tool 是单个原子操作（如调用一个 API、执行一条 SQL）。

只用 Tool 的问题：当 Tool 数量膨胀到几十上百个时，LLM 的选择空间爆炸，准确率急剧下降。缺少语义分组，模型无法理解工具之间的协作关系。无法复用已验证的多步编排逻辑。

Skills 相当于给 Tool 加了一层”目录 + SOP”，让模型先做粗粒度决策，再做细粒度调用。

5 写在最后

从底层写死函数的 Tools，到解耦网络通信的 MCP，再到面向业务包装、依靠“渐进式披露”来管理复杂度的 Skills。看懂这三步，你就真正理解了大厂企业级 Agent 走向标准化、工程化、规模落地的核心架构思路。

保持对前沿技术的敏感度，绝对是拉开差距的关键所在。后续我会持续更新 Agent 记忆机制（Memory）、RAG 等方向的硬核技术解析。

如果你正在找工作，或者对 AI 落地感兴趣，欢迎关注、点赞、在看！你的支持是我持续输出最大动力！

更多相关的八股文小编整理在飞书文档中，关注公众号回复[A005]，获取更多相关八股。