乐于分享
好东西不私藏

微软错了!AI 操作软件的根本方式,不是塞进 Office

微软错了!AI 操作软件的根本方式,不是塞进 Office

微软错了!AI 操作软件的根本方式,不是塞进 Office

2026年,一个让科技圈炸锅的预测正在应验:GUI 的末日,CLI 的复兴。

三个月前,英国科技媒体 The Register 写了一篇措辞激烈的评论:「微软把 Copilot 塞进 Office 应用是错的。AI 要操作软件,必须靠 CLI。」

这篇文章在 LinkedIn 上被疯转,评论区吵成一锅粥。但很快,所有人发现——这帮人说的,好像还真是对的。


一、科技巨头集体「复古」,都在抢做 CLI

如果你关注 AI 圈,这张清单会让你愣一下:

• Anthropic 做了 Claude Code

• OpenAI 做了 Codex CLI

• Google 做了 Gemini CLI

• Block 开源了 Goose

• 初创公司 Plandex 拿到了融资,2M token 上下文窗口直接干到顶

一个有意思的数据是:JetBrains 2025 年的开发者调查显示,62% 的开发者已经在使用至少一个 AI 编程助手。而这些助手,几乎清一色跑在命令行里。

LinkedIn 上有热帖直接喊出:「2026,是 CLI 王者归来之年」

DEV.to 的技术作者们更感性,给这场趋势起了个名字——「Terminal Renaissance」,终端复兴。

此刻你可能会问:为什么?图形界面统治软件行业快四十年了,怎么突然所有人都在往命令行里钻?

答案很简单:GUI 是给人用的,CLI 是给 AI 用的。


二、为什么 AI 操作 GUI,其实又慢又蠢?

要理解这个转变,你得先知道 AI 是怎么「看」 GUI 的。

当你让 AI 操作一个网页或者桌面应用,它实际上是这么干的:

1. 截图——把当前界面拍下来

2. 分析——理解这个界面里有什么按钮、什么菜单

3. 决策——判断该点哪个按钮

4. 执行——模拟鼠标点击或键盘输入

5. 然后回到第 1 步……

每一轮循环,都是一次信息损失。 截图有分辨率,AI 分析有误差,点击有延迟。复杂任务做下来,光在 GUI 里反复操作就耗掉了大半 token 和时间。

这就好比你让一个天才秘书帮你干活,结果他每次都得先把文件拍照发给你确认,再等你手写指令他再执行——低效到令人发指。

而 CLI 呢?

结构化命令进去,结构化结果出来。AI 发一条指令,软件执行,返回结果,完事。整个流程干净利落,没有歧义,没有视觉解析的噪音。

说得更直白一点:GUI 是给人眼设计的,CLI 是给 API 设计的。而 AI,本质上就是一个超级 API。

The Register 的评论里有一句话特别扎心:「微软把 Copilot 塞进 Word 里,就像给一个人发了把螺丝刀,让他隔着玻璃窗去修电视机。」


三、CLI 的进化:不再只是极客的玩具

当然,有人会说:CLI 存在几十年了,为什么现在才火?

因为老 CLI 已经不够用了

传统的命令行工具,输出的是纯文本。你想从一堆日志里提取特定信息?得写 awk、sed、grep,一通操作猛如虎,结果还得靠人肉解析。

新一代 CLI 完全不同。

以 Nushell 为代表的新物种,把输出当作结构化数据来处理。你敲一条命令,返回的东西可以直接用管道传给下一个工具,就像在操作一个 DataFrame。

> ps | where cpu > 10 | sortBy cpu | take 5

这不再是纯文本处理,这是数据流编程

而当 CLI 的输出结构化之后,AI 理解它、解析它、基于它做决策的难度就降到了最低。AI 可以精准提取它需要的信息,而不是在花花绿绿的界面里「猜」哪里该点。

所以这场复兴,不只是 CLI 的回归——是 CLI 的升级。老 CLI 是给程序员用的,新 CLI 是给 AI 用的。


四、谁会受益,谁会出局?

这场变革的受益者,名单已经越来越清晰了:

受益方:

• AI 编程工具(Claude Code、Aider、Plandex)——它们本质上就是 CLI 原住民

• 有强 CLI 的开源软件——AI 更容易集成,社区活跃度会进一步爆发

• 愿意押注 CLI 的软件公司——他们的产品会成为 AI Agent 的首选

承压方:

• 只有 GUI、没有 CLI 的商业软件——如果 AI Agent 没法用你的产品,它就会选别家

• 过度依赖「操作壁垒」的 SaaS——以前靠复杂的图形界面留住用户,以后这条路走不通了

METR(一个研究 AI 自动化能力的机构)有一个让人细思恐极的发现:在复杂开源任务上,有经验的开发者使用 AI 工具后,完成时间反而增加了 19%

原因很残酷——工具需要学习,没有什么是拿来就用的。那些率先掌握新 CLI 工作流的开发者,会和继续依赖 GUI 的人拉开差距。

这场竞赛不是比谁先装上 AI 工具,而是比谁先学会用 AI 能懂的方式和它协作。


五、留给你的问题

写到这里,我突然想起一个朋友的故事。

他是某大厂的高级工程师,技术一流,日常用 IDE 图形界面写代码。去年开始用 Claude Code,兴奋地跟我说:「以后再也不用记那么多快捷键了,让 AI 帮我改就好。」

三个月后再聊,他苦笑着说:「AI 确实能帮我改,但它输出的改动我得在 GUI 里一个个确认,反而比我自己写还慢。」

他后来花了两个周末,专门学习了如何用纯命令行的方式跟 AI 协作。第三周,他告诉我:「这才叫『配了个副驾驶』,之前那叫『在副驾驶后面装了个倒车影像』。」


所以我想把这个问题留给你:

你的日常工作软件,有 CLI 吗?如果没有,你打算怎么让 AI 来操作它?

评论区见。