引言
AI 时代来了,但很多人对 LLM、Skill、MCP 这些概念还是一头雾水。今天我用最通俗的语言,把这些「黑话」讲清楚,让你真正理解 AI 的知识体系是怎么运转的。
LLM:一切的基础
LLM,全称 Large Language Model,俗称大语言模型。可以把它看作是一切的基础,相当于人类的大脑,是在算力层面上的东西。
人们可以选择付费来升级自己的大脑,从而得到更准确、更恰当的回复结果。
常见的大语言模型
国外主流 AI 工具(代表了先进生产力):
ChatGPT / GPT-4o:OpenAI 开发,目前用户量最大 Gemini:Google 开发,深度整合谷歌生态 Claude:Anthropic 开发,长文本处理能力强
国内 AI 工具:
豆包:抖音开发 千问:阿里开发 Deepseek:国内开源模型的黑马
LLM 本质上是「文字接龙机器」——根据你输入的内容,预测下一个最可能出现的词。但它有几个天然的局限:
知识有截止日期:模型训练完成后就不知道新发生的事 无法执行动作:它只能输出文字,不能真正操作你的电脑 上下文有限:虽然窗口越来越大,但依然有处理上限
Skill:AI 的使用说明书
说完了 LLM,接下来讲讲 Skill。
我对于 Skill 的理解,就是具体一项指令的说明书。
AI 能够理解你的指令,但大多数人在想要实现自己的目的或想法时,与 AI 聊天的过程中,指令词不明确,很难让大模型给出满意的答复。
Skill 在此刻就派上用场了。可以对自己常用的指令进行整理,然后按照自己的具体需求、风格写到 Skill 文件里,方便自己下次使用。再遇到同样的需求或问题,就可以直接调用该 Skill 去更高效地达成自己想要的目标。
简单总结:Skill 是提示词/技能,通过预设规则,让 AI 输出更稳定、专业的特定风格内容。
Skill vs LLM 的区别
MCP:让 AI 长出手和脚
MCP,全称 Model Context Protocol,模型上下文协议。它是 Anthropic 在 2024 年发布的一项开放标准。
更通俗来说,它是让 AI 模型能够标准化地连接到外部数据和工具的公用插座。
也可以说,MCP 协议的存在让 AI 模型长出了「手和脚」。
在 MCP 出现之前
在这之前,模型的交互大多都在网页上对话式地进行。想要对一些文件或图片进行处理,也需要先把文件上传到输入框中,再输入指令,AI 给出回复结果。
MCP 改变了什么
MCP 协议可以让大模型来直接操作你的文件,在你的源文件中进行修改。
AI 客户端(如 Claude Desktop) ↓ MCP 协议MCP 服务器(如文件系统、数据库、API) ↓ 调用外部工具和数据MCP 的三个角色
MCP Host:就是你用来和 AI 对话的软件,例如:
Claude Desktop Cursor Cline Cherry Studio
MCP Server:跟传统的 Server 并没有太大的关系,它就是一个程序而已,只不过这个程序的执行是符合 MCP 协议的。大部分的 MCP Server 都是通过本地的 Node 或者 Python 启动的,本质上就是一个程序。
Tool(工具):程序有自己的一些功能,这些功能按照不同的模块就是不同的 Tool。不同的工具实现不同的功能。一个 Tool 就是编程语言里面的一个函数。
实际应用场景
连接文件系统:让 AI 读写你电脑上的文件 连接数据库:让 AI 直接查询和操作数据 连接 API:让 AI 调用各种第三方服务 连接硬件:让 AI 控制智能设备
MCP 的魔力在于标准化。以前每个 AI 工具都要单独对接每个服务,现在只要服务端实现了 MCP 协议,所有支持 MCP 的 AI 客户端都能用。
CLI:你和电脑对话的方式
CLI,全称 Command Line Interface,中文翻译是命令行界面。可以通过输入文本指令来与计算机程序进行交互的方式。
现在我还算比较熟悉的,是 CMD 或 PowerShell。
虽然 CLI 看起来很「极客」,但它其实是最高效的人机交互方式之一。很多 MCP Server 的安装和启动,都需要通过 CLI 来完成。
Agent:会自主思考和行动的 AI
Agent(智能体)是更高层的概念。它不只是回答问题,而是能够:
理解目标:拆解用户的复杂需求 规划步骤:决定先做什么、后做什么 调用工具:通过 MCP 使用各种外部能力 执行任务:一步步完成目标 自我修正:遇到问题时调整方案
一个完整的例子
假设你说:「帮我写一篇关于新能源的公众号推文,配好图,发到草稿箱」
Agent 的执行过程可能是:
调用搜索工具,查找新能源最新资讯 整理信息,生成文章框架 用 LLM 撰写完整文章 调用图片生成工具,创建配图 通过文颜 MCP,将文章排版并发布到草稿箱 返回草稿链接给你确认
整个过程,Agent 自主完成了多步决策和工具调用。
它们如何协同工作
这四者的关系可以这样理解:
Agent(指挥官) ├── LLM(大脑)—— 理解、推理、生成 ├── MCP(神经系统)—— 连接外部世界 └── Skill(技能手册)—— 指导如何行动LLM 提供理解和语言生成能力 MCP 提供与外部工具的标准化连接 Skill 提供特定领域的最佳实践 Agent 将以上三者整合,自主完成复杂任务
普通人如何上手
零代码方案
使用 Claude Desktop、ChatGPT 等产品,直接体验 MCP 集成 配置 CC Switch 等工具,管理多个 AI 客户端和 MCP 服务器
轻度折腾方案
安装 npm 上的 MCP 服务器,如文颜、文件系统等 在 AI 客户端中配置 MCP,扩展 AI 的能力边界
深度玩家方案
自己开发 MCP 服务器,暴露自己的 API 和数据 编写 Skill,定义 AI 的工作流程 构建多步骤 Agent,实现自动化工作流
结语
LLM、Skill、MCP、Agent 并不是相互替代的关系,而是层层递进的能力栈。理解它们的区别和协作方式,才能更好地利用 AI 工具提升效率。
2025 年,AI 正从「聊天工具」进化为「生产力基础设施」。现在入场,正是时候。
夜雨聆风