拿下大厂AI岗(三):Agent架构进化!一次性讲透 Skills 机制到底牛在哪(附面试八股)
点击蓝字,关注我们
大家好,我是小张。
在前两篇文章中,我们带大家深度剖析了 AI Agent 的底层基石:Tools,以及当下爆火的连接协议:MCP。
但如果你最近在研究微软的 Semantic Kernel、AutoGPT 或者是各种企业级的 Agent 编排平台(如 Coze, Dify),会发现大厂在构建复杂 Agent 时,满嘴跑的都是另一个核心概念:Skills。
很多同学学到这里就懵了:我已经懂了 Tools,也知道了怎么用 MCP 连工具,这个突然冒出来的 Skills 到底是什么?它和前两者有什么关系?
今天我们就来扒一扒 Skill 的底层逻辑究竟是什么?它与 MCP、Tools 到底有什么本质区别?
这篇文章同样将从基础概念、工作机制、核心对比,一直讲到面试高频八股文。全是干货,建议先收藏再看,留着面试前复习!

1 基础概念:什么是 Skill (技能)?
如果我们要把大模型打造成一个超级员工,那么tools,MCP,Skills 在当中发挥的作用则对应如下:
-
Tools:是起子、扳手、螺丝刀。
-
MCP:是让各类工具都能插上的“通用插座”。
-
Skills:则是《如何组装一张宜家桌子的标准作业流程》。
以往,我们给大模型装上 Tools,它知道“我有螺丝刀”。但遇到复杂的业务(比如:先查本周流水,再对比上周,最后画出对比图并发送邮件),大模型往往不知道怎么编排这套复杂的动作,极易产生幻觉瞎调。
Skills 就是对“特定上下文 Prompt + 业务逻辑 + 若干强相关 Tools”的一层高级封装。只要 Agent 触发了这个 Skill,它就瞬间进入了对应场景的“专家模式”,获得这套 SOP,并清楚底下的子工具该怎么配合使用。
一个 Skill 就是一个包含 SKILL.md 文件以及可选脚本或其他资源的文件夹(建议使用子文件夹来组织辅助脚本、模板和数据文件)。下面是一个skill的示例。

在这个图片中,每一部分的内容和功能如下:
SKILL.md是必需的,它skill 的核心文件,包含frontmatter: 里面为name、description,主要告诉LLM 这个 skill 是什么、什么时候触发。正文:具体的工作指令和流程。
scripts文件夹,按需选择,可有可无。主要用来放可执行的脚本文件。skill 执行时可以调用这些脚本来完成具体任务。例如:process.py 用 Python 做代码分析。
references文件夹,按需选择,可有可无。主要用来放静态知识/参考文档。给 skill 提供额外的上下文信息。例如style-guide.md团队的代码风格规范。skill 执行时会读取这些文件作为参考依据,在 SKILL.md 里用 [style-guide](references/style-guide.md) 引用。
assets文件,按需选择,可有可无。放模板、图片等资源文件。比如可放template.docx 提供审查报告的模板,用于生成输出或作为格式参考。

2 核心进阶:“渐进式披露”机制
如果只是简单的把工具封装成 Skills,随着数量的增多,必定会面临一个极其现实的工程问题:每个 Skill 下面还有十几个具体的 Tools 参数说明。由于 Token 限制,不可能在系统初始 Prompt 里把它们全塞给大模型。
而Skills的设计者更早想到了这个问题,并提供了解决方案——渐进式披露。通俗来说,就是“你看一层,我给你看下一层,绝不一次性填鸭”。
在复杂 Agent中,渐进式披露是这样工作的:
第一层:目录级披露。初始上下文里,系统只向大模型披露一个包含各个 Skill 粗略描述或分类的列表。大模型分析用户请求,决定调用 数据分析 Skill。也就是红线框出的部分,大模型会读取每一个Skill对应的段落,对SKill功能有大致了解。

第二层:按需展开。当模型决定进入 数据分析 Skill 后,系统才会动态披露该 Skill 内部的详细细节:专用的 Prompt 引导、底层数据库的 Schema,以及 查询SQL_Tool、画折线图_Tool 的详细 API 格式。比如这里需要检查python代码检查,他才会阅读对应的.md文件,否则不会阅读。

第三层:执行与反馈大模型在这个被“聚焦”的局部上下文中完成计算,并将最终结果返回到上一层。
为什么要用渐进式披露?它就像是打开一棵树的节点。通过“由面到点”的层层下钻,极大降低了大模型的认知负荷,彻底避免了“大词典一把梭”导致的 Token 爆炸和幻觉,使得 Agent 的技能库具备了理论上的无限扩展性。
而渐进式披露作为Skills的核心亮点,往往在面试中也是最常问的问题之一。

3 重点考察:Skills, MCP, Tools的本质区别?
从开始投递到现在,也差不多一个月了,历经了数十次面试,不下于两个面试官问到SKills与MCP,tools的本质区别,或者说Skills出现的必要性。这里我们就来总结一下(以下为个人观点,如有错误或偏见欢迎大家在评论区指出)。
Tools:这是最早出现的定义,本质就是function calling。它能够将大模型连接到外部世界,但是不同的LLM接口不同,如果更换LLM则需要重写相关代码,增加了代码量,继而引出了MCP。
MCP:MCP的出现,主要是为了解决tools重写的问题,让不同平台的LLM都能够调用同一个tools减少代码量。但本质上,大模型调用哪个工具还是根据输入+大模型本身的思考,如果大模型思考出错调用错工具会导致整个流程出错。另外,大模型选择工具的时候,需要提前了解每一个tools的基本输入以及功能,当tools增加,他需要了解所有的tools,token量的消耗是极大的。继而引出SKills。
Skills: 我认为可以把SKills理解为专家的经验。当一个流程已经充分的经过前人的验证,每一步需要调用什么tools已经确定,我们把它包装成为Skills那么大模型就不会再出现调用错工具的情况,提高正确率。同样每个Skills会包含若干tools,由于Skills的渐进式披露机制,我们不需要读取所有的tools描述,减少了token消耗。

4 Agent Skills 高频面试八股文
为了帮大家拿下 Offer,这里同样总结了有关 Skills 与整体架构面试中常问的问题,建议背诵!
Q1:什么是 Agent Skills架构中的“渐进式披露”,它解决了什么痛点?
答:这是一种分层按需提供信息的架构模式。解决痛点:当系统拥有海量工具或长文本操作指南时,一次性将所有 API 定义丢给 LLM 会导致 Token 超限、推理变慢并极易诱发幻觉。通过渐进式披露,模型首先只能看到Skill的摘要。等它明确意图并做出初步选择后,系统再将选中的 Skill 内部具体的工具细节暴露到当前上下文中,以此实现认知聚焦。
Q2:Skills 和 Tool 的本质区别是什么?为什么不能只用 Tool?
Skills 是对一组相关 Tool 的逻辑封装,附带描述、使用场景和编排逻辑;Tool 是单个原子操作(如调用一个 API、执行一条 SQL)。
只用 Tool 的问题:当 Tool 数量膨胀到几十上百个时,LLM 的选择空间爆炸,准确率急剧下降。缺少语义分组,模型无法理解工具之间的协作关系。无法复用已验证的多步编排逻辑。
Skills 相当于给 Tool 加了一层”目录 + SOP”,让模型先做粗粒度决策,再做细粒度调用。

5 写在最后
从底层写死函数的 Tools,到解耦网络通信的 MCP,再到面向业务包装、依靠“渐进式披露”来管理复杂度的 Skills。看懂这三步,你就真正理解了大厂企业级 Agent 走向标准化、工程化、规模落地的核心架构思路。
保持对前沿技术的敏感度,绝对是拉开差距的关键所在。后续我会持续更新 Agent 记忆机制(Memory)、RAG 等方向的硬核技术解析。
如果你正在找工作,或者对 AI 落地感兴趣,欢迎关注、点赞、在看!你的支持是我持续输出最大动力!
更多相关的八股文小编整理在飞书文档中,关注公众号回复[A005],获取更多相关八股。

夜雨聆风