为什么2026年最先进的AI工具反而回到了命令行?两种和计算机交流的方式CLI和GUI
2026 年初,一个叫 Claude Code 的 AI 工具火了。
虽然名字里带个”Code”,但它干的事远不只是写代码,它几乎什么都能干。
但很多人第一次打开它的时候愣住了:这不就是以前的 “命令行界面” 吗?(CLI,Command-Line Interface)。
没有按钮,没有菜单,没有任何可以点击的东西,只有一个光标在那闪,等着输入文字。
2026 年了,居然还在用这个?
不只是 Claude Code。Google 出了 Gemini CLI,OpenAI 出了 Codex CLI,整个 AI 行业最前沿的工具,都选择了”命令行”作为载体。甚至有了一个说法,叫”终端文艺复兴”。
在 claude code 获得巨大成功后,为了扩展用户市场,Anthropic 又推出了 Cowork,这是一个桌面的图形用户界面(GUI,Graphical User Interface)客户端。
它把 Claude Code 的底层能力包进了一个图形界面里,对非程序员更加友好。菜单、按钮、进度条,一切都看得见摸得着,这就是我们常见的软件的样子。
Claude Code 和 Cowork,我都使用了一段时间,作为一个非专业程序员,我发现每次想做点什么的时候,更倾向于打开 Cowork 而不是 Claude Code。
图形界面终归更容易接受,窗口摆在那里,按钮看得见,有一种”东西就在手边”的踏实感。
不过用着用着,感觉更费功夫更费token,更多限制,真不如直接使用 Claude Code。毕竟 Cowork 就是由 Claude Code 写出来的。
要想明白这两者的区别,就需要了解一下这两种和计算机交流的方式:命令行(CLI)和图形界面(GUI)。
一、命令行:看不见的力量
命令行的本质极其简单:你用文字下达指令,计算机用文字回复结果。没有图标,没有窗口,没有任何可以拖拽的东西。
它比图形界面早出现了将近二十年,是人机交流最原始的形态。
但”原始”不等于”简陋”。命令行的这种简洁,恰恰给了它几样图形界面很难拥有的东西。
命令行世界里有个东西叫”管道”,一个竖线符号 |,能把一个命令的输出直接接到下一个命令的输入。
举个例子,假设有一个很大的日志文件,想从中找出包含”ERROR”的行,只看最近 10 条:
cat log.txt | grep "ERROR" | tail -10
三个小工具用管道串了起来:cat 读文件,grep 筛选含”ERROR”的行,tail 取最后十条。每个工具只做一件事,但串在一起就能完成一个复杂任务。就像乐高积木,管道是连接件,可以拼出无数种组合。而在图形界面里,每个功能是一座独立的小岛,想让 A 软件的输出自动流进 B 软件,大概率只能靠复制粘贴。
命令行还更精确、有更高的信息密度。图形界面里调参数靠滑块或下拉菜单,想要菜单里没有的值?没办法。命令行里直接写数字,73.5 就是 73.5,精度完全由你决定。一行命令可以同时指定操作对象、操作方式、输出格式,同样的意思在图形界面里得分散在好几个菜单和对话框里,点好几下才能表达完。
还有一点容易被忽略:命令行的操作是可以沉淀的。图形界面里的操作是”动作”,点击、拖拽、选择,做完就消失了。但命令行里的操作是”文字”,文字留得下来。今天敲的一串命令可以存成脚本,明天直接运行,发给同事也能运行。每次操作都不是一次性消耗,而是沉淀成一个随时可调用的工具。20 年前学的命令今天依然能用,命令行使用者的能力是随时间复利增长的。
说了这么多优点,还得面对一个现实:既然命令行这么强这么好,为什么绝大多数人从来不碰它?
答案其实很简单。打开一个终端,面前只有一个闪烁的光标。它能做什么?不知道。有哪些命令?不知道。每个命令有什么参数?还是不知道。所有能力都是隐形的,只有已经知道的人才能使用。
打开一个图形界面的软件呢?菜单在那里,按钮在那里,图标在那里。不知道怎么用?四处点点看看,大概就能摸清楚。
这不是小缺点,这是命令行几十年来始终无法走向大众的根本原因。它的问题从来不是”不够强”,而是”看不见它的强”。
二、图形界面:看得见的舒适区
图形界面的核心发明,是把计算机能做的事变成可以看见、可以点击、可以拖拽的视觉元素。本质上,它做的就是一件事:把可能性摆在你面前。
打开一个从未用过的软件,菜单栏列出所有功能分类,工具栏摆着常用操作的图标,右键弹出上下文菜单。不需要读说明书,不需要记任何东西,光是”看”就能知道这个软件大概能做什么。
这背后有一层更深的设计智慧:图形界面大量使用物理世界的隐喻,文件夹、桌面、窗口、回收站,这些词本身就来自日常生活。不需要理解文件系统的树形结构,只要知道”把文件拖进文件夹”。计算机从一个需要学习的陌生机器,变成了直觉可用的工具。
用户体验设计领域有一条经典原则叫”识别优于回忆”:好的界面让人通过”看到”来做选择,而不是从记忆里”想起”该怎么操作。图形界面把选项呈现出来让你挑,极大减轻了记忆负担,这也是它的学习曲线远比命令行平缓的原因。
图形界面像一家布置好的自助餐厅,所有菜品摆在面前,看到什么拿什么;命令行像一个没有菜单的餐厅,想吃什么得自己说出菜名,不知道有什么菜就只能饿着。
除了能被”发现”,图形界面还提供即时的视觉反馈。拖一个文件到文件夹,立刻看到它出现在那里了;调一个滑块,立刻看到颜色变了;点击发送,立刻看到消息飞出去。这种”操作→结果”的即时可见,建立了信心,减少了焦虑。命令行里呢?执行一个命令,很多时候什么反馈都没有,没有输出可能意味着成功了,也可能意味着根本没执行。对不熟悉的人来说,这种沉默让人心里发毛。
但图形界面的”看得见”,也正是它的天花板所在。 界面上的每一个功能都需要被”设计”出来:设计成按钮、菜单项、对话框、滑块。设计不出来的功能、放不下的选项,对使用者来说就等于不存在。另外当设计的功能过多时,”直观”本身也变成了负担:打开手机的设置页面,几百个选项分散在十几个层级里,大多数人从来没完整翻过一遍,翻过也记不住。
而且图形界面里的功能是封闭的单元,想把 A 功能的结果自动传给 B 功能,除非软件专门设计了联动,否则大多数时候做不到。
图形界面给了使用者一种错觉:因为能看到所有按钮,就觉得自己掌握了所有功能,但其实那只是设计师选择呈现出来的一部分。
三、当命令行遇到 AI
命令行和图形界面的对立,几十年来似乎形成了一个定局:命令行强大但看不见,图形界面看得见但有天花板。传统的解法是让它们各司其职,需要效率用命令行,需要直觉用图形界面。
但 2026 年正在发生的事,指向了另一种可能:命令行不需要借助图形界面来弥补自己的短板。
命令行最大的问题是什么?是”看不见”。不知道能做什么,不知道该输入什么,不知道执行后发生了什么。三个”不知道”,挡住了几乎所有普通人。
AI 解决的恰恰就是这三个问题。这不是巧合。AI 的输入输出本质上就是文本,命令行也是文本界面,二者是天然的同类。让 AI 在命令行里工作,就像让鱼儿回到水里。
而且它的解法,不是把命令行变成图形界面,而是让文字本身变得能”看见”。
不知道能做什么?直接问:“这个文件夹里有什么可以整理的,如何整理?”,“这些照片能用什么方式批量重命名?”。AI 会根据你当前的具体情境告诉你该如何做,不是一个固定的菜单,而是针对此刻需求动态生成的回答。
不知道该输入什么?用自然语言说就行。“帮我把这些 PDF 里的表格提取出来合并成一个 Excel”。你不需要知道任何命令的名字,AI 把你的自然语言翻译成精确的操作。
不知道执行后发生了什么?AI 会解释。不再是沉默的光标,而是”已经处理了 47 个文件,其中 3 个格式有问题,我跳过了,原因是……”。每一步都有交代,每个结果都有反馈。
回到那个餐厅的比喻。自助餐厅的菜品是固定的,再丰盛也有摆完的时候。但如果那个没有菜单的餐厅突然来了一个无所不知的服务员,你说”想吃点清淡的海鲜”,他立刻告诉你有什么、怎么做、要多久,这家餐厅反而比自助餐厅更好。因为它的后厨从来就没有限制,只是以前缺一个能沟通的人。
AI 就是那个服务员。
AI 让命令行学会了”说话”。借助于此,命令行变得”可被看见”也更加简单。
想在终端底部显示一个实时状态栏,告诉你当前在用什么模型、上下文空间还剩多少、调用了什么能力、执行了哪些动作?以前要自己写脚本、调配置,门槛不低。
现在你只需要告诉 AI”我想在终端底部看到这些信息”,它就帮你搭好。这就是命令行在创造属于自己的可见性,不是模仿图形界面的按钮和窗口,而是在文本的世界里,用文本自己的方式,把”看不见”变成”看得见”。
命令行没有变,它还是那个文字进、文字出的朴素界面。变的是它不再沉默了。三个”不知道”被逐一解决之后,命令行原本的优势被释放了出来。
所以 2026 年最先进的 AI 工具回到命令行,不是技术的倒退,而是命令行终于补上了自己几十年来唯一的短板。图形界面不会消失,因为人们永远需要”看得见摸得着”的直觉感。但命令行不再需要图形界面替自己说话了,它找到了自己的声音。
如果你从未碰过命令行,现在确实是最好的时机。不是因为它变简单了,而是你终于能用自己的语言,释放它的全部力量。
想试试?你可以点击下方的查看原文链接,访问 智谱 Coding Plan 网站查看入门教程。

推荐使用 Claude Code 作为命令行工具,将背后的大模型切换为智谱或 Kimi。
大模型的使用需要付费,最低档大约 40 元一个月。相信我,这是非常必要的一笔投入。
当然,如果可以,你应该使用 claude 或者 openai。
夜雨聆风