OpenClaw 又进化了:我用一行命令,让它学会了操作任意软件

这段时间，OpenClaw 的热度确实越来越高了。

越来越多人开始拿它做联网搜索、自动化工作流、知识管理，甚至把它当成自己的第二操作系统来折腾。你会发现，大家已经不满足于让 AI 只会聊天、只会查资料、只会写点东西了。真正吸引人的，是它开始像一个能调度工具、理解任务、持续执行的 Agent。

但我折腾了一圈之后，反而更确定一件事：

OpenClaw 现在最值得看的，不是它会不会聊天，也不是能不能联网，而是它能不能真正学会“用软件”。

因为一个 Agent 再聪明，如果一碰到真实软件就卡壳，本质上还是停留在“会想，不会干”的阶段。

最近我在 GitHub 上看到一个很有意思的项目：CLI-Anything：https://github.com/HKUDS/CLI-Anything

它最打动我的地方，不是“又多了一个新工具”，而是它给了我一种很强的感觉：这东西很可能是在给 OpenClaw 补手和脚。

一句话说，CLI-Anything 想做的事是：

用一行命令，把任意软件变成 Agent 能调用的 CLI。

如果你对 CLI 不敏感，也没关系。你可以把它简单理解成：它在尝试把原本只适合人手动点来点去的软件，翻译成一套 AI 能理解、能调用、能串联的命令接口。

而一旦这层能力能被 OpenClaw 接住，味道就完全变了。原本很多只能靠人手操作的软件，就开始有机会变成 OpenClaw 工作流里真正可调用的一环。

● ● ●

为什么 OpenClaw 火了，但还没火到最狠的那一步

我觉得 OpenClaw 这波热度，本质上是很多人第一次看到了 Agent 真正落地的样子。

过去我们说 AI 助手，大多数时候还只是停留在对话框阶段。会聊天、会总结、会翻译、会联网，已经算不错。

但 OpenClaw 这类框架，把 AI 往前推了一步：它开始接工具、接技能、接流程，让 AI 不只是回答问题，而是去执行任务。

这很关键。因为从“回答”走向“执行”，才是 Agent 真正有生产力的分水岭。

但问题也恰恰出在这里。一个 Agent 想执行任务，它的上限从来不只取决于模型有多聪明，更取决于它到底能调多少真实能力。

搜索是一种能力。文档读写是一种能力。任务管理是一种能力。但现实世界里真正复杂、真正有价值的那部分工作，很多都还藏在各种软件里。

图像处理软件、视频编辑软件、办公软件、建模软件、绘图软件、直播软件、各种本地工具……这些才是很多真实工作流的核心。

OpenClaw 真正更狠的一步，不是再加几个 API，而是开始进入真实软件世界。

而大多数 Agent 到了这里，能力就开始掉档。所以我越来越觉得，OpenClaw 下一步真正值得看的，不只是再多接几个 API，而是：

它能不能开始大规模操作现实里的软件。

这才是更狠的一层。

● ● ●

为什么“用软件”这件事，一直是 Agent 的硬伤

AI 现在很会“生成”，但不一定很会“操作”。

你让它写个方案、找个资料、整理个观点，问题不大。但你让它真正帮你完成一个复杂任务，它就很容易卡在最后几步：

打开某个软件
调用某个功能
处理某种格式
导出某个结果
再把结果交给下一个工具

这几步，才是真正决定“能不能交付”的地方。

很多 Agent 会思考、会规划，但真正卡住它们的，恰恰是软件执行和交付那最后 20%。

过去大家常见的解决思路，其实就三种。

第一种：等官方 API

这条路最稳，但也最慢。很多软件压根没有 API。有 API 的，也经常只开放很浅的一层。你想用深一点、完整一点、贴近真实操作一点的能力，往往还是碰不到。

第二种：做 GUI 自动化

这条路看起来很酷，演示效果也很炸。但说白了，它太脆。按钮一改，流程就可能崩。界面一变，坐标就可能失效。一旦进入复杂场景，维护成本就会上来。它适合做演示，不太适合长期稳定干活。

第三种：每个软件手搓一层适配

当然也能做，而且很多团队就是这么做的。但问题也很现实：太贵，太慢，太难规模化。 每接一个软件，你都要重新理解架构、重新设计调用方式、重新测试、重新写文档、重新维护。对个人开发者和效率玩家来说，这种事做两次还有新鲜感，做十次基本就疲了。

API、GUI 自动化、手搓适配层都各有问题，CLI-Anything 的价值在于它卡在了中间那个最有机会的空档。

而 CLI-Anything 打的，恰好是这三条路中间的那个空档。

● ● ●

CLI-Anything 的狠，不是多一个工具，而是多一层翻译器

CLI-Anything 最有意思的地方，在于它不是在“替代软件”，而是在做一件更聪明的事：

把软件翻译成 Agent 更容易使用的命令层。

为什么是 CLI？因为 CLI 本来就是人和机器之间最成熟的一种中间层。它的优点对 Agent 来说几乎是天然的：

命令清晰
参数明确
输出容易结构化
能串进脚本和工作流
更容易测试和复用
比 GUI 自动化稳定得多

GUI 更像给人看的界面，CLI 更像给 Agent 用的接口。

而 CLI-Anything 做的，就是尝试把这层接口的生成过程自动化。

按照项目里的描述，它不是只生成一个简单命令，而是会去分析代码库、设计命令结构、生成可安装的 CLI、补测试、补文档，甚至给生成出来的 CLI 补上 SKILL.md 这种更适合 Agent 发现和调用的能力描述文件。

这就很关键了。因为它解决的不是“某一个软件能不能接”的问题，而是在探索一条更普适的路：

能不能让更多软件，以更低门槛进入 Agent 世界。

● ● ●

为什么我觉得它和 OpenClaw 特别配

很多工具单看都不错，但不一定能和 OpenClaw 形成化学反应。CLI-Anything 不一样。它和 OpenClaw 放在一起时，适配感非常强。

原因很简单：

CLI-Anything
负责把软件翻译成可调用的命令
OpenClaw
负责理解自然语言、调度工具、串联流程

两者的分工几乎是天然互补的。

过去你装了很多软件，它们只是你电脑里的“孤岛”。每个都很强，但彼此分散，AI 也碰不到。

但如果这些软件逐步被翻译成 CLI，再被 OpenClaw 纳入技能或工具链里，它们就不再只是“我电脑里有这些软件”，而会变成：

可调用的能力节点
可串联的工作流积木
可复用的自动化模块

这就是为什么我会说，CLI-Anything 给 OpenClaw 补的不是边角料，而是手和脚。

一旦这件事跑通，OpenClaw 就不只是聊天助手，也不只是能调几个 API 的框架，而更像一个真正能调动本地软件、云端服务和任务流程的统一操作层。

这一下，想象空间就完全打开了。

● ● ●

一行命令，改变的不是效率，而是边界

“一行命令”这四个字很容易被理解成效率提升。好像只是把原本很麻烦的流程缩短了一点。

但我觉得它真正改变的，不只是效率，而是边界。

因为过去你想让 Agent 接入一个新软件，这件事本身门槛就很高。高到很多人根本不敢开始。

但如果现在出现一种思路，能把“接入软件”这件事，逐渐压缩成接近教程级操作，那用户最直接的感受就会变成：

原来我也可以让 Agent 去调更多真实工具。

这就不是“更方便”那么简单了。而是控制范围突然变大了。

以前你觉得 Agent 只能帮你做一部分事。现在你开始意识到，它也许能进入你整套数字工作流。

对用户来说，这种心理冲击比效率提升更大。因为这意味着 Agent 的边界，不再只是对话框里的那点能力，而可能慢慢延伸到你电脑里真正常用的软件栈。

● ● ●

这套玩法，最容易让人上头的 3 个方向

如果只是停留在概念上，这篇文章还是容易飘。真正让人想关注、想转发、想试试看的，是他们能立刻脑补出场景。

我觉得 OpenClaw + CLI-Anything 这套思路，最容易上头的场景有三个。

1. 把本地软件拉进 Agent 工作流

这是最直观的一层。以前很多本地软件非常强，但 Agent 碰不到。你知道它能做图、做视频、做文档、做剪辑、做渲染，但它们和 Agent 世界之间像隔了一道墙。

如果有办法把这些软件翻译成 CLI，再接进 OpenClaw，那就意味着它们开始有机会变成统一工作流的一部分。

这件事一旦成立，OpenClaw 调度的就不只是搜索和网页，而是整个软件生态。

2. 把能力沉淀成可复用的 Skills

OpenClaw 本来就很适合用 Skills 来组织能力。而 CLI 天然就适合被包装成 skill、被组合进流程、被复用。

今天接一个图像软件。明天接一个办公工具。后天接一个视频工具。再配合搜索、知识库、任务流，你会慢慢搭出自己的 Agent 积木体系。

这比单纯装插件有意思得多。

3. 把“会演示的 Agent”推进成“能交付的 Agent”

这是我最看重的一点。现在很多 Agent 演示都很炫：会思考、会规划、会解释、会调用一些工具，看起来很聪明。

但真正交付时，经常会掉进一个坑：它会前 80%，最后 20% 还要你自己手动补完。而那最后 20%，往往恰恰藏在真实软件里。

如果 OpenClaw 能稳定地调更多软件，它离“把事做完”就会更近一步。这不是多一个功能的问题，而是从“看起来聪明”往“真的能干活”迈了一大步。

本地软件接入、Skills 沉淀、交付型 Agent，这三类场景最容易把读者从“觉得酷”推到“我也想试试”。

● ● ●

这篇文章最值得写的，其实不是项目，而是趋势

如果只是把 CLI-Anything 写成一篇普通 GitHub 项目推荐，太可惜了。

因为更值得讲的，不是这个项目本身有多酷，而是它踩中了一个非常关键的方向：

把数据图放在“趋势判断”这一节，比放在前面更像证据，而不是装饰。

Agent 的下一步，不只是更会想，而是更会动手。

过去大家卷的是模型。后来卷搜索、卷记忆、卷工作流。接下来真正拉开差距的，我越来越相信会是这一层：

谁能把现实里的软件世界，大规模拉进 Agent 体系。

谁能做到这件事，谁的 Agent 才不是一个更聪明的聊天框，而是一层真正意义上的操作系统。

从这个角度看，CLI-Anything 的价值就不只是“某个项目挺新”，而更像一个信号：

软件 Agent 化，已经不是只属于大厂和重工程团队的命题了。

它开始变成普通开发者、效率爱好者也能参与的一条路。这件事，才是真正值得兴奋的部分。

● ● ●

如果你也在折腾 OpenClaw，这可能是最值得试的新玩法之一

最近看了不少 OpenClaw 的玩法。有人卷联网，有人卷知识库，有人卷自动化，有人卷部署形态。

这些都没问题。但如果你问我，哪条线最有“下一阶段味道”，我会选这一条：

别只让 OpenClaw 接更多 API，试着让它开始操作更多真实软件。

因为一旦它能调用的软件足够多，OpenClaw 就不只是一个好用的 Agent 框架，而会慢慢变成你整套数字工作流的总控台。

这也是为什么我会对 CLI-Anything 这么上头。它不一定是唯一答案，但它很像一个非常明确的方向信号：

未来的 Agent，不只是更会说，而是更会做。

而这个“会做”，不是多几个回复模板，不是多一点推理，而是能真正进入软件、进入流程、进入交付。

如果这条路继续往前跑，未来我们调度的可能不只是几个工具，而是整台电脑、整套软件栈，甚至一整条生产链。而它的起点，也许真的就是：一行命令。

● ● ●

结尾

所以如果你最近也在研究 OpenClaw，我真心建议你别只盯着模型、搜索和记忆。

去看看这种“把任意软件接进 Agent”的思路。因为这很可能才是下一阶段，真正把 Agent 从“看起来很强”推进到“真的能干活”的关键一步。

OpenClaw 这波热度，不该只停留在“更像一个好聊的 AI”。如果它真的能把越来越多的软件能力接进来，它的上限会高得多。

而 CLI-Anything 这种项目让我第一次比较清晰地看到：这件事，已经不只是想象了。

如果你也在折腾 OpenClaw，或者正在研究 Agent 工作流，欢迎留言聊聊：

你最想让 OpenClaw 接入哪个软件？