乐于分享
好东西不私藏

当智能体成为工作入口,软件商的机会在哪里?

当智能体成为工作入口,软件商的机会在哪里?

前段时间我写过一篇文章,讲怎么在 WorkBuddy 里装 Lovart 的 Skill,然后让 WorkBuddy 帮我配图,创作节奏一气呵成不中断。

其实在SkillHub 里,不仅有Lovart、LibTV 这类AI 创作工具提供的 Skill,还有有腾讯会议、WPS、飞书、钉钉等传统办公软件提供的 Skill。你看见了,安装了,对着 WorkBuddy 说一声,它就去帮你干,听起来就像是「给 AI 装插件」,让它能干更多事。

我突然意识到,这本质不是「我用 AI 工具完成了一件事」,而是「AI 调用了另一个工具,替我完成了这件事」。

注:收听播客👆

两层 Skills:服务人 + AI Agent

以前聊 Skill,我以为我懂了。

我后来翻了一下 Lovart 这边的 Skill 文档,看到它面向人类用户,在系统内置提供了「亚马逊产品套图」「品牌套装」这类预设工作流,点一下,你不需要懂设计,复杂的流程直接帮你封装好。这我理解,服务人类用户的。

但同时,Lovart 也提供了另一套对外的 Skill,那套 Skill 里面写的不是「如何帮用户设计」,而是「如何被 WorkBuddy、OpenClaw 这类通用 AI Agent 调用」,包括 CLI 接口、参数规范、调用方式,全都在里面。

我当时看到这个,有点晃了一下。

原来 Skill 有两层,第一层是内置给人用的工作技能,第二层是对外给 AI 用的调用技能。

给 AI 用的接口:GUI > API > CLI

顺着这个想下去,就看到了一个更完整的图景。

说起来,「给 AI 用的接口」这件事,行业其实已经走了好几步了。

最早是 GUI 界面,屏幕是给人眼看的,按钮是给人手点的,整个产品都是面向人类设计的。

然后是 API 阶段,为了让不同软件之间能互通,各家开始开放接口,但那个接口是给程序员用的,写代码调用,对 AI Agent 来说还是有门槛。

最近这一步是 CLI 命令行。我之前专门写过一篇文章聊这个,钉钉在发布悟空 Agent 的时候,宣布重写了底层代码,完成全面 CLI 化改造。飞书更是直接开源了 Lark CLI,把 2500 多个 API 封装成命令行工具,覆盖即时通讯、云文档、多维表格、日历、会议、邮箱……一口气全进去了。

为什么 CLI 比直接用 API 更适合 AI,因为 MCP 这类协议虽然也是专为 AI 设计的,但要把所有工具的名称和参数格式全部注入 AI 的上下文里,工具一多,Token 消耗就夸张了,ScaleKit 做过基准测试,同样的任务 MCP 的 Token 消耗可能是 CLI 的几十倍。CLI 就轻得多,一行命令干一件事,清晰高效。

所以飞书、钉钉相继做 CLI,不只是为了让程序员方便,本质上是在把自己的能力暴露给 AI Agent 来调用。它们的用户边界,正在从「人」延伸到「人 + Agent」。

未来很可能是这样的,每个人桌面上跑着一个通用 AI Agent,WorkBuddy 也好,OpenClaw 也好,钉钉悟空也好,它们成为你日常工作的入口。你不再直接打开 WPS,你跟你的 Agent 说「帮我整理一下这份会议纪要」,然后它在底层悄悄把任务分解,调用 WPS 处理文档,调用腾讯会议拉取录音,调用 Lovart 生成汇报配图,最后把结果推给你。

这个调用关系靠什么实现,靠的就是 Skill + CLI + MCP 这套机制。

Skill 在这里面扮演的角色,像是接口文档,但不只是人看的那种,而是 AI 能直接理解和执行的那种。它让不同的 AI Agent 之间,可以标准化地互相调用对方的能力。

就像 HTTP 协议让不同的服务器之间能够通信,Skill 让不同的 AI 之间能够协作。

这个生态一旦成熟,「AI 替你完成工作」这件事,才算真正完整。不是一个全能的 AI,而是一群分工明确的 AI,在标准化协议下各司其职,合力完成你的任务。

这才是 Skill 这个东西,真正有意思的地方。

软件智能化:两个发展阶段

然后我就在想,这件事对那些软件来说,到底意味着一个什么处境。

一般的软件公司,第一反应肯定是,把 AI 能力加进来。界面里加个 AI 对话框,文档软件里加个 AI 润色按钮,设计工具里加个 AI 生成功能。这是第一阶段,让用户在你的软件里用 AI,体验更智能,但用户还是需要打开你的软件、操作你的界面。

这条路现在几乎每家都在走,没什么特别的。

难的是第二阶段。

当大多数人的桌面上都住着一个通用 AI Agent 的时候,用户的工作入口就不再是你的软件了,是那个 Agent。用户跟 Agent 对话,Agent 帮用户调用工具,你的软件变成了 Agent 背后的「服务层」。

这时候你该怎么办,你要提供接口,要写 Skill,要让 AI Agent 能方便地找到你、调用你、信任你。

钉钉、飞书已经在做了,这不是它们的善意,这是它们意识到用户入口在转移之后,不得不做的事。

按这个发展路径,软件商肯定是焦虑的。

用户不直接操作我们的软件了,那我们跟用户的关系是不是断了?用户会不会直接用竞争对手的,因为对方的 Skill 写得更好,Agent 更熟悉对方?

我觉得这个担心可以理解,但逻辑上想想,没那么可怕。

Agent 调用你的软件,背后一样要验证身份,一样要走订阅权益,一样要保护用户的个人数据。这些不会因为多了一层 Agent 就消失,用户还是要开通会员,还是要授权,软件商的商业闭环还在。

变的只是,用户不再亲自操作你的界面了,而是把操作交给了 Agent 代劳。就像网银出现之后,你去银行柜台的次数减少了,但你跟那家银行的关系没变,你的钱还在那儿,只是你不用亲自跑窗口了。

更何况,如果你不提供接口,你的竞争对手会提供。

以后用户之间分享的,可能不再是「这个软件好用,你装一下」,而是「这个 Skill 好使,你装一下,它调用的是 XX 服务」,然后用户的 Agent 调用你的服务,你悄无声息地多了一个用户。

你的品牌曝光变少了,但流量来了。

这种增长方式,和以前的「下载量」「日活」,是完全不同的逻辑。

未来软件商的机会在哪里?

顺着这个再往深想一步,未来机会在哪儿。

大的通用 AI Agent 入口,比如 WorkBuddy、钉钉悟空、OpenClaw,背后是腾讯、阿里这些大厂,一般的软件商没有资源去和他们竞争那个入口。

真正值得做的,是在某个垂直赛道里,成为对 AI Agent 最友好的服务商。

比如,我是一家电商运营 SaaS,我提供的那个 Skill 文档写得极其清晰,覆盖的接口是最完整的,调用体验是最顺滑的,错误处理是最优雅的,那在 Agent 看来,我就是这个赛道里最好的选择。

Agent 会倾向于调用我,用户的任务会更多地流向我,我的先发优势会越来越大。

这个逻辑,和早期移动互联网时代的「先抢 App Store 入口」有点像,但维度不同。以前抢的是用户注意力,现在抢的是 AI 信任度。

很多公司还在卷「我的产品里 AI 功能有多强」,但可能更值得问的问题是,「我的产品能不能被 AI 方便地调用」。

前者是把自己包装成 AI 工具,后者是把自己变成 AI 生态里的基础设施。

这两个定位,未来的空间完全不同。

一个好的类比是,当年电商起来的时候,一部分人跑去开网店,另一部分人去做商家的配送、仓储、支付基础设施。那两类生意,规模不是一个量级的。

现在的 AI 浪潮里,也有这样的分叉。


所以我最近一直在想,这件事的终点会在哪里。

想起我写那篇「配图一气呵成」文章时的感受,那时候我觉得最爽的,是「不中断」。不用切窗口,不用重新找状态,整个创作流一直在。

那只是一个人、一台电脑、两个 AI 工具之间的协作。

但如果这个协作规模放大呢,如果你的 Agent 背后能调用几十个、上百个专业服务,每一个都在它最擅长的领域帮你完成那一块——财税的算税、设计的出图、会议的纪要、代码的调试——然后无缝拼在一起交给你。

也许就是这样的,某一天你打开你的 AI Agent,把一件工作描述给它,它帮你拆解,调用十几个不同的服务和工具,把结果拼起来,交给你。

你不知道它用了哪些 Skill,不知道它在背后调了哪些服务,也不需要知道。就像你今天打开浏览器搜一个东西,不会去想背后是哪台服务器在处理你的请求一样。

那些服务商的名字,你可能永远不会看到。但它们在的,一直在,默默地处理着流过来的每一个任务。

那是一种新的存在方式,不靠用户注意力,靠 AI 信任度。

参考:

你桌面上住着 AI 吗?通用智能体三种活法

面试被问懵:什么是给AI用的APP?不懂CLI模式,可能真的会被淘汰

我是怎么在 WorkBuddy 里调用 Lovart ,把 AI 画图这件事跑通的

—End—

如果觉得不错 随手点个在看转发三连吧

关注+星标⭐ 可第一时间收到更多精彩思考和总结

您的支持是我继续写下去的动力

注:原创不易,合作请在公众号后台留言,未经许可,不得随意修改及盗用原文。