CLI复兴与AI_Agent四层架构:为什么1960年代的技术突然火起来了?

CLI复兴与AI Agent四层架构：为什么1960年代的技术突然火起来了？

GUI是给人点的，CLI是给机器/AI说的。

这是一篇仅适合AI开发者阅读的博客内容。

2024到2025年，GitHub Copilot CLI、Claude Code、ChatGPT CLI相继发布。这个1960年代诞生的老技术，突然成了科技巨头们争夺的新高地。

一个有趣的现象发生了：全世界的程序员都在往终端里跑 。他们不再点击图形界面上的按钮，而是像打字一样输入自然语言，让AI替他们干活。

这不只是 “老技术回春”。一场关于AI如何工作的架构变革，正在悄然发生。

第一层：CLI——AI的“手”

你可能觉得CLI很原始。毕竟GUI（图形用户界面）才是主流——点点鼠标就能完成操作，为什么还要记命令？

但对AI来说，CLI才是真正的“母语”。

完全同构：大模型文本进、文本出，CLI也是命令进、结果出。两者天然匹配。

零视觉误差：GUI是给和人看的——鼠标点击依赖于像素位置、颜色、布局。但AI不需要看界面，它只需要处理文本。CLI是标准化文本，永远不会“点错”。

母语训练：Claude、GPT、Gemini的训练数据里，几乎包含了GitHub上所有的Shell命令、代码片段和终端操作。这些命令就是AI的“成长奶粉”。

所以AI天然适配CLI。不需要任何“智能GUI”来讨好AI——终端才是AI的舒适区。

第二层：Agent——AI的“脑”

CLI只是一个“门”，负责接收输入、渲染输出。真正理解意图、制定计划的，是Agent。

2024年是个分水岭。之前，用GPT-4调用工具的成功率只有60%-70%。2024年后，Claude 3、GPT-4的 tool-use准确率突破90%，Agent才真正可用。

Agent的本质是一个推理循环：

1
2
3
4
5
6
7
8
9
感知（理解输入和当前状态）    ↓推理（决定下一步做什么）    ↓执行（调用工具、修改状态）    ↓观察（检查结果是否符合预期）    ↓重新感知……（直到任务完成）

这vs传统脚本的“线性执行”完全不同：

传统脚本：写好步骤1、2、3，按顺序执行，出错就退
Agent：动态执行，根据结果调整策略，出错了就尝试修复

换句话说：传统脚本是“按图施工”，Agent是“见机行事”。

这就是为什么2025年AI Agent市场从54亿美元增长到76亿美元。预测2032年将达到932亿美元。79%的企业已在生产环境使用Agent。

第三层：Skill——AI的“肌肉记忆”

Agent很强，但每次从零推理会导致两个问题：效率低、结果不稳定。

想象一下：每次让Agent做代码审查，它都要从头理解“什么是安全漏洞”。如果你能把最佳实践固化下来，让Agent直接调用呢？

这就是Skill。

1
2
3
4
5
6
7
Skill: /security-review  触发：用户调用或Agent判断需要时  流程：    1. git diff 获取变更    2. 静态分析扫描漏洞模式    3. 检查依赖的 CVE    4. 生成结构化报告

Skill vs Prompt的本质区别：

对比项	Prompt	Skill
本质	一段输入文本	完整的执行流程
包含	指令	指令+工具调用+结果处理
谁执行	LLM解读后执行	Agent按固定流程执行
可组合性	低	高（Skill可调用其他Skill）

资料来源：Anthropic官方Skill定义、OpenAI技能规范

2025年10月，Anthropic为Claude引入Skills。2025年12月开放标准发布于agentskills.io。2026年2月，GitHub Agent HQ推出，生态系统已超过280,000个开源技能。

27个主流代理支持SKILL.md标准，包括Claude Code、GitHub Copilot、OpenAI Codex、Google Gemini CLI、Cursor、Windsurf等。

技能作为“大脑”编排复杂工作流，MCP工具作为“手”执行单个操作。

第四层：MCP——AI的“插头”

一个老问题：每个AI工具要接入外部服务，都要写一遍集成。

Claude Code接入GitHub → 一套集成。 Copilot接入GitHub → 又写一套。 Cursor接入GitHub → 再写一套。

这就是“N×M问题”：N个AI工具 × M个外部服务 = N×M套集成。

MCP（Model Context Protocol）解决了这个问题：

1
[任何AI工具] ←→ MCP协议 ←→ [任何MCP服务器]

一次实现，到处可用。

MCP vs Function Calling的区别：

对比项	Function Calling	MCP
作用域	单次对话内	跨工具、跨会话
标准化	仅定义调用格式	定义完整协议
可移植性	绑定特定LLM	任何MCP客户端都能用
生命周期	对话结束失效	持久化，跨会话复用

资料来源：MCP官方文档、Linux Foundation治理规范

2025年12月，Anthropic将MCP捐赠给Linux Foundation旗下的Agentic AI Foundation。AWS、Google、Microsoft、Bloomberg都是铂金级支持。

17,000+社区服务器，每月9700万次SDK下载。50+官方业务系统服务器覆盖所有主流服务。

MCP已获得广泛支持：Claude、OpenAI ChatGPT、Google Gemini、Cursor、Windsurf、VS Code。

三个核心结论

CLI ≠ Agent（接口 vs 引擎）
Skill ≠ Prompt（流程 vs 话术）
MCP ≠ Function Calling（协议栈 vs 单次调用）

给开发者的建议

使用CLI工具： Claude Code、GitHub Copilot CLI——用自然语言试试
关注MCP生态：看有哪些服务器能连接你常用的服务
把团队最佳实践封装成Skill：代码审查、部署流程、安全检查——固化下来，新人也能用
如果做开发者工具：问自己“我的产品能被Agent调用吗？”如果不能，考虑暴露MCP接口

2025年不是CLI复兴的一年，而是AI原生开发架构成熟的一年。

而2026年，将会是智能体元年。

四层架构各司其职：CLI是门，Agent是脑，Skill是肌肉记忆，MCP是插头。组合起来，就是AI时代的开发栈。

参考资料

市场数据

AI Agent市场：2025年93.2B（CAGR 44.6%）— Splunk Top 10 AI Trends 2025
79%企业已在生产环境使用Agent，83%组织计划部署Agent AI系统

MCP生态

17,000+社区服务器，每月9700万次SDK下载
Anthropic将MCP捐赠给Linux Foundation（2025.12）
50+官方业务系统服务器

Skill生态

280,000+开源技能
27个代理支持SKILL.md标准

工具更新

GitHub Copilot CLI：2026.2正式版，/fleet并行子代理
Claude Code：v2.1.117（2026.4），120K+ stars

核心参考

掘金AI编程《CLI为什么在2025年突然复兴四层架构》
agentskills.io（Skill规范）
modelcontextprotocol.io（MCP官方）

本文约2000字 | 写于2026-05-03