乐于分享
好东西不私藏

CLI复兴与AI_Agent四层架构:为什么1960年代的技术突然火起来了?

CLI复兴与AI_Agent四层架构:为什么1960年代的技术突然火起来了?

CLI复兴与AI Agent四层架构:为什么1960年代的技术突然火起来了?

GUI是给人点的,CLI是给机器/AI说的。

起床气 max

这是一篇仅适合AI开发者阅读的博客内容。

2024到2025年,GitHub Copilot CLI、Claude Code、ChatGPT CLI相继发布。这个1960年代诞生的老技术,突然成了科技巨头们争夺的新高地。

一个有趣的现象发生了:全世界的程序员都在往终端里跑 。他们不再点击图形界面上的按钮,而是像打字一样 输入 自然语言,让AI替他们干活。

这不只是 “老技术回春”。一场关于AI如何工作的架构变革,正在悄然发生。

AI四层架构.diagram

第一层:CLI——AI的“手”

你可能觉得CLI很原始。毕竟GUI(图形用户界面)才是主流——点点鼠标就能完成操作,为什么还要记命令?

但对AI来说,CLI才是真正的“母语”。

完全同构:大模型文本进、文本出,CLI也是命令进、结果出。两者天然匹配。

零视觉误差:GUI是给和人看的——鼠标点击依赖于像素位置、颜色、布局。但AI不需要看界面,它只需要处理文本。CLI是标准化文本,永远不会“点错”。

母语训练:Claude、GPT、Gemini的训练数据里,几乎包含 了GitHub上所有的Shell命令、代码片段和终端操作。这些命令就是AI的“成长奶粉”。

所以AI天然适配CLI。不需要任何“智能GUI”来讨好AI——终端才是AI的舒适区。

第二层:Agent——AI的“脑”

CLI只是一个“门”,负责接收输入、渲染输出。真正理解意图、制定计划的,是Agent。

2024年是个分水岭。之前,用GPT-4调用工具的成功率只有60%-70%。2024年后,Claude 3、GPT-4的 tool-use准确率突破90%,Agent才真正可用。

Agent推理循环.flowchart

Agent的本质是一个推理循环

1
2
3
4
5
6
7
8
9
感知(理解输入和当前状态)    ↓推理(决定下一步做什么)    ↓执行(调用工具、修改状态)    ↓观察(检查结果是否符合预期)    ↓重新感知……(直到任务完成)

vs传统脚本的“线性执行”完全不同:

  • 传统脚本:写好步骤1、2、3,按顺序执行,出错就退
  • Agent:动态执行,根据结果调整策略,出错了就尝试修复

换句话说:传统脚本是“按图施工”,Agent是“见机行事”

这就是为什么2025年AI Agent市场从54亿美元增长到76亿美元。预测2032年将达到932亿美元。79%的企业已在生产环境使用Agent。

第三层:Skill——AI的“肌肉记忆”

Agent很强,但每次从零推理会导致两个问题:效率低、结果不稳定。

想象一下:每次让Agent做代码审查,它都要从头理解“什么是安全漏洞”。如果你能把最佳实践固化下来,让Agent直接调用呢?

这就是Skill。

1
2
3
4
5
6
7
Skill: /security-review  触发:用户调用或Agent判断需要时  流程:    1. git diff 获取变更    2. 静态分析扫描漏洞模式    3. 检查依赖的 CVE    4. 生成结构化报告

Skill vs Prompt的本质区别

对比项
Prompt
Skill
本质
一段输入文本
完整的执行流程
包含
指令
指令+工具调用+结果处理
谁执行
LLM解读后执行
Agent按固定流程执行
可组合性
高(Skill可调用其他Skill)

资料来源:Anthropic官方Skill定义、OpenAI技能规范

2025年10月,Anthropic为Claude引入Skills。2025年12月开放标准发布于agentskills.io。2026年2月,GitHub Agent HQ推出,生态系统已超过280,000个开源技能。

27个主流代理支持SKILL.md标准,包括Claude Code、GitHub Copilot、OpenAI Codex、Google Gemini CLI、Cursor、Windsurf等。

技能作为“大脑”编排复杂工作流,MCP工具作为“手”执行单个操作。

第四层:MCP——AI的“插头”

一个老问题:每个AI工具要接入外部服务,都要写一遍集成。

Claude Code接入GitHub → 一套集成。 Copilot接入GitHub → 又写一套。 Cursor接入GitHub → 再写一套。

这就是“N×M问题”:N个AI工具 × M个外部服务 = N×M套集成。

MCP(Model Context Protocol)解决了这个问题:

1
[任何AI工具] ←→ MCP协议 ←→ [任何MCP服务器]

一次实现,到处可用。

MCP vs Function Calling的区别

对比项
Function Calling
MCP
作用域
单次对话内
跨工具、跨会话
标准化
仅定义调用格式
定义完整协议
可移植性
绑定特定LLM
任何MCP客户端都能用
生命周期
对话结束失效
持久化,跨会话复用

资料来源:MCP官方文档、Linux Foundation治理规范

2025年12月,Anthropic将MCP捐赠给Linux Foundation旗下的Agentic AI Foundation。AWS、Google、Microsoft、Bloomberg都是铂金级支持。

17,000+社区服务器,每月9700万次SDK下载。50+官方业务系统服务器覆盖所有主流服务。

MCP已获得广泛支持:Claude、OpenAI ChatGPT、Google Gemini、Cursor、Windsurf、VS Code。

三个核心结论

三组核心区别.comparison

  1. CLI ≠ Agent(接口 vs 引擎)
  2. Skill ≠ Prompt(流程 vs 话术)
  3. MCP ≠ Function Calling(协议栈 vs 单次调用)

给开发者的建议

  1. 使用CLI工具: Claude Code、GitHub Copilot CLI——用自然语言试试
  2. 关注MCP生态: 看有哪些服务器能连接你常用的服务
  3. 把团队最佳实践封装成Skill: 代码审查、部署流程、安全检查——固化下来,新人也能用
  4. 如果做开发者工具: 问自己“我的产品能被Agent调用吗?”如果不能,考虑暴露MCP接口

2025年不是CLI复兴的一年,而是AI原生开发架构成熟的一年。

而2026年,将会是智能体元年。

四层架构各司其职:CLI是门,Agent是脑,Skill是肌肉记忆,MCP是插头。组合起来,就是AI时代的开发栈。


参考资料

市场数据

  • AI Agent市场:2025年93.2B(CAGR 44.6%)— Splunk Top 10 AI Trends 2025
  • 79%企业已在生产环境使用Agent,83%组织计划部署Agent AI系统

MCP生态

  • 17,000+社区服务器,每月9700万次SDK下载
  • Anthropic将MCP捐赠给Linux Foundation(2025.12)
  • 50+官方业务系统服务器

Skill生态

  • 280,000+开源技能
  • 27个代理支持SKILL.md标准

工具更新

  • GitHub Copilot CLI:2026.2正式版,/fleet并行子代理
  • Claude Code:v2.1.117(2026.4),120K+ stars

核心参考

  • 掘金AI编程《CLI为什么在2025年突然复兴四层架构》
  • agentskills.io(Skill规范)
  • modelcontextprotocol.io(MCP官方)

本文约2000字 | 写于2026-05-03

@华光馬騳驫