乐于分享
好东西不私藏

AI 时代的"操作系统困境":当 Agent 遇上专业软件

AI 时代的"操作系统困境":当 Agent 遇上专业软件

你是否注意过一个有趣的现象?

现在越来越多人把最难的任务丢给 OpenClaw,而 AI Agent 们干活的时候,选的都是 Claude Code——不是 Cursor,不是 VS Code,更不是什么 GUI Agent。

为什么?

AI 的”三肢瘫痪”

原因很简单:Claude Code 的 CLI 做得太好了。

有状态、自描述、好用还强大。Agent 拿起来就能干活,不需要跟它”搏斗”。

但问题是,绝大多数真正的专业软件,都没有这样的 CLI。

GIMP、Blender、LibreOffice、OBS——每一个都是重量级工具,但 AI Agent 基本碰不了

你能做的上限,就是截图点点点的 GUI Agent。

效果嘛……懂的都懂 😊

所以 HKUDS 做了 CLI-Anything

一行命令,让任意软件接入 OpenClaw、nanobot、Cursor、Claude Code 等 Agent 框架。

CLI-Anything 概览

一行命令,让任何软件变成 Agent 的原生工具:

/cli-anything ./gimp

你的 Agent 就拿到了一整套 GIMP 的 CLI。

/cli-anything ./blender

Blender 同理。

LibreOffice、OBS Studio、Shotcut、Audacity、Inkscape、Kdenlive……都能搞。

不是玩具,是真的在调软件

这是最关键的区别:不是 wrapper,是真的在调 GIMP / Blender / LibreOffice 去渲染。

  • • REPL 交互模式
  • • JSON 结构化输出
  • • 撤销/重做
  • • 直接调用真实软件后端

目前已经支持 11 款专业软件1,508 项测试全部通过

软件
领域
测试数
GIMP
图像编辑
107
Blender
3D建模
208
Inkscape
矢量图形
202
Audacity
音频制作
161
LibreOffice
办公套件
158
OBS Studio
直播录制
153
Kdenlive
视频剪辑
155
Shotcut
视频剪辑
154
Draw.io
图表绘制
138
Zoom
视频会议
22
AnyGen
AI生成
50

7 阶段全自动

从代码分析到发布上线,全程无需人工介入:

  1. 1. 🔍 分析 — 扫描源码,映射 GUI 操作到 API
  2. 2. 📐 设计 — 规划命令分组、状态模型
  3. 3. 🔨 实现 — 构建 Click CLI
  4. 4. 📋 规划测试 — 生成测试计划
  5. 5. 🧪 编写测试 — 实现完整测试套件
  6. 6. 📝 文档 — 写入测试结果
  7. 7. 📦 发布 — 生成可安装的 CLI

架构一览

CLI-Anything 架构

核心设计原则

  • • 真实软件集成 — CLI 生成合法的项目文件,然后交给真实应用去渲染
  • • 灵活的交互模式 — 有状态的 REPL + 子命令模式
  • • 一致的使用体验 — 统一的 REPL 界面
  • • Agent 原生设计 — 内置 --json 参数输出结构化数据
  • • 零妥协的依赖策略 — 真实软件是硬性要求

未来的软件生态

今天的软件为人而生👨‍💻

明天的用户是 Agent🤖

HKUDS 正在做的事情,就是连接 AI Agent 与全世界软件的桥梁。

让每一个专业软件,都能被 AI 操控。


本文相关开源项目地址,请关注公众号「光影织梦」后回复「CLI-Anything」获取。