乐于分享
好东西不私藏

别再被漫天的AI概念和工具绕晕了,看这张图就够了!

别再被漫天的AI概念和工具绕晕了,看这张图就够了!

后台有人私信我,AI 的概念和工具层出不穷,让人很容易迷失在各种缩写和名词里——MCP、Agent、Vibe Coding、Harness Coding、Cursor、Claude Code、Coze、OpenClaw……

的确,AI 行业正处于”概念通胀”阶段。要把这些概念讲清,最核心的逻辑是:从”能力层次”出发,建立一套从”原子工具”到”全自动系统”的坐标系。

下面是我整理的AI概念全系列对照图,一张图搞清楚AI概念和工具图谱。欢迎收藏关注。

喜欢看中文的朋友可以收藏下面这张图:


AI工具进化层级

层级
概念名称
核心定义
应用场景
代表性工具/平台
L1 Skill / MCP
AI 触达物理世界的”万能插座”。
查天气、订机票、读写本地文件、运行代码。
ChatGPT 插件, 各类 API 封装, MCP Servers
L2 Agent(智能体)
具备独立规划和执行能力的数字雇员。
帮我调研特定行业并生成报告;帮我重构这个模块的代码。
Claude Code

Copilot, Replit Agent, Custom GPTs
L3 Orchestration(编排)
定义 AI 协作的逻辑、流程和状态。
设计严密的财务审批流程;构建确定性的工业自动化工作流。
LangGraph

CozeDify, n8n
L4 Multi-Agent System(MAS/多智能体)
像公司一样运作的虚拟专家团队。
策划一场大型活动;写一本包含插图和数据分析的书;Cursor 内部的 Composer 模式。
CrewAI

Cursor Composer, Windsurf (Cascade)
L5 Autonomous Ecosystem(自主生态)
具备独立经济、定时运行、自我进化的数字组织。
你设定一个理财 Agent,它每周自动分析账户状况、自主调整仓位,全程不需要介入;AI 驱动的 Web3 自主 DAO。
OpenClaw

Hermes Agent

L2 与 L4 正在融合:

– Cursor 目前支持同时运行多达 8 个并行 Agent 来执行不同的子任务。 

– Claude Code 虽然在交互上像 L2(单兵作战),但在处理复杂任务时,它内部会进行任务拆解并调用子专家模型,这在技术层面更接近 L4,但在产品定位上它仍保持了 L2 的简洁感。


意图转换层(交互方式)

这部分不属于层级,而是如何使用上述层级的工具——不同交互方式代表人在使用 AI 时的不同角色:

交互方式
核心特征
代表性工具
Chatbot(聊天机器人)
最原始的”问答”交互,不具备自主行动力,需要人一步步引导。
ChatGPT, DeepSeek
Vibe Coding(氛围编程)
意图驱动,靠”感觉”和 AI 实时博弈。你描述你想要什么,AI 边做你边改,共同摸索出最终结果。
Cursor

Claude CodeGitHub Copilot
Harness Coding(驾驭编程)
约束驱动,靠”规则”和测试来驾驭 AI。你设定边界条件、测试用例和质量门槛,AI 在框架内自主探索。
LangGraph

(约束框架), OpenClawHermes AgentCursor Linter / Rules

底层协议与连接层

核心逻辑: 解决 AI 如何”感知”外部数据、如何”触达”物理世界。

概念/协议名称
核心定义(扫盲点)
应用场景
代表性实现
MCP(Model Context Protocol)
Anthropic 发起的通用连接协议。让 AI 模型用同一种语言连接所有本地数据和工具,任何模型拔插即用。
让 Claude 直接读取 Obsidian 笔记;让 Agent 读写本地数据库或控制终端。
Claude Desktop, Cursor, MCP Servers(GitHub)
Function Calling(函数调用)
大模型原生支持的”动作接口”。让模型输出结构化指令来驱动代码执行。
AI 决定调用”查天气”函数或”下订单”函数。
OpenAI Function Calling, Claude Tool Use
API(接口)
传统的应用程序接口。是 AI 获取特定云端数据的”信息源”,按需取水。
接入 Google Search 搜索结果;调用 Stripe 进行支付。
Google Search API, Serper, Twilio

关键提醒

Cursor / Claude Code / Copilot 不属于某一个单一的进化层级。

它们是”集成开发环境”,内部同时集成了 L1(MCP)、L2(Agent)甚至 L4(多智能体)。从用户的实际体验来说,它们是 Vibe Coding 的最佳载体——你在实时对话中引导 AI,AI 边做你边改。

Coze / Dify / n8n 属于 L3(编排层)。

虽然它们可以创建单体 Agent,但它们存在的核心价值是让你设计”如果……就……”的逻辑流程——这是编排,不是单个 Agent 能完成的工作。

OpenClaw / Hermes Agent 目前处于 L2 到 L5 的过渡地带。

• OpenClaw 因为能深度接管社交账号、电脑 UI 且支持定时任务,已经比普通 Agent 更接近”数字代理人”。

• Hermes Agent(或类似自主交易智能体)开始具备 L5(自主生态)的雏形:它可以自主决定交易时机,甚至管理数字资产,全程无需人工介入。


理解这五个层级不是为了背概念,而是为了在遇到具体问题时,知道该从哪里入手——

  你想让 AI 帮你做一件具体的事?从 L1 MCP 开始。  你想让 AI 独立完成一个任务?找 L2 Agent。  你想让 AI 按照你的流程协作运行?上 L3 编排。  你想让 AI 像团队一样分工?用 L4 多智能体。  你想让 AI 自主运转、自动进化?那已经是 L5 了。  

不知道从哪一层开始?没关系,大多数人的起点都是 L1——先把一个 MCP 接上,你就已经入门了。