乐于分享
好东西不私藏

CLI的春天:当软件从GUI城墙走向Agent原野

CLI的春天:当软件从GUI城墙走向Agent原野

CLI的春天:当软件从GUI城墙走向Agent原野

一、现象:三天之内,三座城墙倒塌

2026年3月27日,钉钉CLI正式上架GitHub,以Apache-2.0协议开源,首批开放AI表格、日历、待办、DING消息等10项核心产品能力。

24小时后,3月28日,飞书Lark CLI v1.0.0同步上线,MIT协议,覆盖消息、日历、文档、多维表格、邮箱、视频会议、任务、云空间等11个业务领域。

几乎在同一周,网易云音乐宣布开放外部Agent对播放和播单管理能力的直接调用;淘宝桌面版完成了OpenClaw适配。

这不是巧合。这是GUI城墙在Agent压力下的系统性崩塌。

二、分析:为什么必须是CLI?

图形用户界面(GUI)是过去30年软件工业最伟大的发明之一。它让计算机从程序员的专属工具变成了普通人的日常伴侣。但在Agent时代,GUI成了最大的阻碍。

GUI的本质是视觉引导。它要求用户先看见、再理解、再操作。按钮在哪里,菜单如何展开,流程如何跳转——这些都需要人类视觉系统的参与。Agent没有眼睛,或者说,Agent的视觉处理成本远高于人类。让一个AI去”看见”一个按钮并”点击”它,其技术复杂度远超直接调用底层API。

CLI的本质是能力暴露。命令行是软件最底层的调用方式,没有中间层的视觉包装,没有为了用户体验而设计的间接路径。对AI来说,有了CLI,调用平台能力就像执行系统指令一样直接。

这解释了为什么OpenClaw——那只两个月内GitHub星标突破25万的红色龙虾——从底层就是CLI驱动的架构。它通过执行Shell命令协调多步骤工作流程,自然语言指令在后台被翻译为系统调用,没有GUI的层层阻隔。

飞书拿到满分5分的Agent友好度评估,评语是”AI Agent原生CLI该做的事,它基本都做了”。这不是赞誉GUI的消亡,而是承认一个技术现实:在Agent与软件的交互中,简洁性战胜了易用性

三、历史:这让人想起互联网的浏览器战争,以及更早的UNIX哲学

1995年,网景Navigator与微软Internet Explorer争夺用户桌面。那场战争的决定性因素不是技术先进性,而是谁更能成为用户访问互联网的默认入口

但CLI的故事远比浏览器更古老。1969年,UNIX操作系统诞生,其设计哲学之一是”做一件事,并做好”。程序之间通过管道(pipe)连接,一个程序的输出成为另一个程序的输入。这种模块化的设计思想,让小型工具能够组合成复杂的工作流。

GUI的出现打破了这种组合性。每个软件都是一个封闭的岛屿,数据被锁死在各自的应用程序中。用户需要在不同窗口间切换,手动复制粘贴,成为了”人肉集成器”。

Agent时代,CLI的回归实际上是在重建UNIX时代的组合性——只不过这次的”管道”不再是Shell命令,而是Agent的调度逻辑。飞书的Lark CLI支持2500+API,钉钉CLI覆盖10项核心能力,这些开放的接口就像是重新铺设的数字管道,让AI能够像搭积木一样组合不同平台的能力。

GUI时代,软件争夺的是用户的眼球和手指。DAU、停留时长、点击率——这些指标衡量的都是人在软件中的沉浸程度。软件是目的地,用户主动打开、浏览、点击。平台的价值在于”留住用户”。

Agent时代,这套逻辑正在失效。当用户对着智能助手说”帮我查一下下周的日程,避开有冲突的时间段,然后订一家合适的餐厅”,执行过程可能涉及日历、地图、餐饮平台多个系统,但用户感知不到中间经过了哪个平台,甚至不关心。平台的价值从”留住用户”变成了”被Agent调用”。

软件正在从目的地变成能力组件。这让人想起浏览器战争后期的另一个转折点:当网页不再是内容的容器,而变成应用的平台,操作系统的重要性就开始让位于浏览器。今天的CLI开放,本质上是软件厂商在Agent时代重新定位自己的尝试——与其被Agent绕过,不如成为Agent的底层基础设施。

但历史不会简单重复。浏览器战争的结果是平台集中化,少数巨头控制入口。Agent时代的CLI开放,却可能走向相反的方向:当所有平台都暴露底层能力,Agent成为调度中枢,权力的转移方向是从平台到Agent,从集中到分散。

更重要的是,这一次的转变速度远超历史。从浏览器战争到移动互联网,花了近20年。从GUI到CLI的Agent化,只用了三个月。

四、趋势:Agent调用频次正在取代DAU

钉钉和飞书的路径分岔,揭示了平台对这一趋势的不同判断。

飞书的策略是分层开放,构建Agent生态。OpenClaw插件拉拢开发者,智能体平台aily服务普通员工,Lark CLI向所有Agent框架开放——三层布局,同一套底层能力。飞书的判断是:Agent在企业能走多深,很大程度上取决于平台上沉淀的上下文质量。把执行能力向外开放,让所有Agent进来调用,上下文资产的价值就被放大。

钉钉的策略是底层重构,生态闭环。用一年时间重写代码,让产品能力变成AI可直接调用的系统指令;以”悟空”为统一调度入口,阿里生态内的淘宝、支付宝、阿里云以Skills形式接入,实现跨平台全链路操作。钉钉的判断是:核心商业能力需要在闭环内统一调度,而不是作为零件交给外部Agent自由拼装。

两种路径,一个共识:衡量平台价值的指标正在移动

DAU、用户停留时长、点击率这些过去十年的核心数字,正在被”Agent调用频次”悄悄替代。当用户不再打开App,而是对智能助手下指令,平台之间的竞争就从争夺用户注意力,变成了争夺被Agent调用的机会。

这种转变对商业模式的冲击力是深远的。过去十年,互联网平台的盈利模式建立在用户停留时长之上——广告需要眼球,电商需要浏览,内容需要沉浸。但Agent调用是一次性的、目标明确的、无中间过程的。用户说”订一份外卖”,Agent调用美团API完成订单,整个过程可能只需要几秒钟,用户甚至不会打开美团App,不会看到任何推荐流,不会受到任何营销信息的影响。

这意味着什么?意味着注意力经济正在让位于意图经济。平台不再需要想方设法”留住用户”,而是需要确保当用户产生明确意图时,自己的API能够被Agent优先调用。这要求平台重新思考自己的核心能力——不是界面设计,不是内容运营,而是服务质量和API的稳定性、完备性、易用性。

网易云音乐开放了播放和播单管理能力的直接调用,淘宝桌面版完成OpenClaw适配。这些分散在不同赛道的动作,指向同一个方向:主动向Agent开放,还是被Agent绕过——这个选择,所有数字平台迟早要面对。

更值得警惕的是,这种转变可能是不可逆的。一旦用户习惯了通过Agent完成操作,就很难回到手动打开App、逐级点击菜单的旧模式。就像智能手机普及后,功能机迅速消失一样。GUI不会完全消亡,但会退守到特定的场景——那些需要人类视觉判断、创意表达、情感交流的领域。而绝大部分功能性操作,将被CLI+Agent的组合接管。

五、追问:人类准备好了吗?

从第一台计算机诞生,80余年。我们经历了从命令行到图形界面,从桌面软件到移动应用,从Web 1.0到移动互联网。每一次交互范式的跃迁,都伴随着权力的重新分配和技能的重置。

GUI让普通人能用计算机,创造了数十亿规模的数字人口。Agent时代,CLI的回归不是让普通人退回命令行,而是让AI替人执行命令。普通人将不需要学习任何界面,只需要说出需求

但这意味着更深层的依赖。当软件的底层能力完全向Agent暴露,Agent成为人与数字世界交互的唯一中介,几个根本性的问题浮出水面。

第一,信任与问责。当Agent代替人完成跨平台操作,出现错误时谁来负责?是下达指令的用户,是执行操作的Agent,是提供API的平台,还是某个中间环节的开发者?现有的法律框架和商业伦理都没有准备好回答这个问题。

第二,透明与理解。GUI的价值之一是可预见性——用户能看到自己在做什么,能随时中断或回退。Agent的CLI调用对用户是黑箱,一次指令可能触发数十次API调用,用户既不理解过程,也无法干预。这种不透明性在涉及金钱、隐私、安全的关键场景下是危险的。

第三,权力与垄断。当Agent成为新的操作系统层,谁控制Agent,谁就控制了数字世界。如果少数几个Agent平台垄断了与所有服务的连接,它们将获得比今天的操作系统厂商更大的权力。这种权力的集中,是否会催生新的监管挑战?

第四,技能与退化。如果人类不再需要学习任何界面,只需要说出需求,那么当Agent失效时,人类是否还有能力手动完成任务?技能的退化一旦发生,就很难恢复。

当平台价值由Agent调用频次定义,平台是否还有动力维护面向人的产品质量?当所有平台都变成能力组件,Agent成为操作系统之上的新层,这一层的权力由谁监督?

2026年注定是一个AI靠Agent蔓延的年度。不再只是聊天AI,而是链接、颠覆和重构——不仅仅是软件和互联网,而是生产力、劳动力、经济、社会,甚至政治。

从命令行到GUI,我们走了30年。从GUI回到命令行,只用了三个月。

技术的钟摆在来回摆动,但每一次摆动都比上一次更高、更快、更不可逆。

这一次,我们可能没准备好。


本文基于公开资料整理,部分信息来自新浪财经2026年3月29日报道《飞书、钉钉开源CLI,Agent开放路径走向分岔》