一行命令,让任何软件变成 AI Agent 的原生工具
🤖 AI 很聪明,但很无力
现在的 AI Agent 推理能力很强,但在操控真实专业软件这件事上,真的很拉胯。
要么是这样:
GUI 自动化 — 截图、点像素,脆弱得像个纸糊的机器人。今天能跑,明天软件弹个对话框就挂了。
要么是这样:
阉割版 API — 官方 API 只覆盖 10% 的功能,剩下的 90% 你想都别想。
要么是这样:
玩具级实现 — 重新写一个「简化版软件」,功能砍得七零八落,然后告诉你「这是 AI 友好的」。
就……很难用。
🦫 那怎么办?
来自港大 HKUDS 实验室的 CLI-Anything 给了个很聪明的解法:
把任何专业软件变成 Agent 的原生工具,功能一个不少。
怎么做到的?
很简单 —— 一行命令:
/cli-anything:cli-anything ./gimp
它会全自动跑完 7 个阶段:
-
🔍 分析 — 扫描源码,把 GUI 操作映射到 API -
📐 设计 — 规划命令分组、状态模型 -
🔨 实现 — 构建 Click CLI + REPL + JSON 输出 -
🧪 测试 — 单元测试 + 端到端测试(真实软件验证) -
📝 文档 — 自动生成完整文档 -
📦 发布 — 打包成 pip 可安装的包
然后你就得到了一个:
# 随手安装到 PATH
pip install -e .
# 随意调用
cli-anything-gimp project new --width 1920 --height 1080
cli-anything-gimp layer add -n "背景" --color "#1a1a2e"
cli-anything-gimp --json export render poster.png
不是截图,不是点像素,是直接调用真实软件后端。
📊 硬核数据说话
目前已经在 11 款主流软件 上验证通过:
| 软件 | 用途 | 测试数 |
|---|---|---|
| 🎨 GIMP | 图像编辑 | 107 |
| 🧊 Blender | 3D 建模 | 208 |
| ✏️ Inkscape | 矢量图形 | 202 |
| 🎵 Audacity | 音频制作 | 161 |
| 📄 LibreOffice | 办公套件 | 158 |
| 📹 OBS Studio | 直播录制 | 153 |
| 🎬 Shotcut | 视频剪辑 | 154 |
| 📞 Zoom | 视频会议 | 22 |
| 📐 Draw.io | 图表绘制 | 138 |
总计:1,508 项测试,100% 通过。
每个 CLI 都是真实后端验证 —— LibreOffice 生成真实 PDF,Blender 渲染真实 PNG,OBS Studio 操作真实场景。
🔑 核心特点
1. 零妥协的集成方式
直接对接真实软件后端 —— Blender 的 bpy API、LibreOffice 的 headless 模式、GIMP 的 Script-Fu。后端缺失?测试直接失败,不跳过,不糊弄。
2. Agent 原生设计
每个命令内置 --json 参数,输出结构化数据供 Agent 直接消费。不需要解析截图,不需要正则匹配,直接拿 JSON 用。
3. 有状态的 REPL
进入交互模式后,Agent 可以像跟人类对话一样操作软件 —— 创建项目、添加元素、撤销重做、导出结果。
4. 统一的使用体验
所有生成的 CLI 共享同一个 REPL 界面(叫 ReplSkin),品牌横幅、风格化提示符、命令历史、进度指示器 —— 全都一样。
5. 覆盖全流程
从代码分析 → 架构设计 → 实现 → 测试 → 文档 → 发布,全自动,一条命令全搞定。
🚀 支持的平台
目前已支持:
-
Claude Code — 官方插件市场,安装即用 -
OpenClaw — 原生 SKILL.md -
OpenCode — 5 个斜杠命令 -
Codex — skill 接入 -
Qodercli — 插件支持
更多平台正在接入:Cursor、Windsurf……
💡 什么时候用
场景 1:专业软件 Agent 操控
“帮我用 Blender 渲染一个 3D 产品展示图”
“用 GIMP 把这批照片统一调色”
场景 2:复杂工作流自动化
“用 LibreOffice 生成 100 份定制化 PDF 报告”
场景 3:替代 GUI 自动化
受够了 RPA 的脆弱性?试试这个。
场景 4:快速构建 Agent 工具集
把你的内部工具/开源项目喂给它,一键生成 Agent 可用的 CLI。
📦 快速上手
第一步:添加 Claude Code 插件市场
/plugin marketplace add HKUDS/CLI-Anything
第二步:安装插件
/plugin install cli-anything
第三步:开搞
/cli-anything:cli-anything ./gimp
5 分钟后,你就有了一个完整的 GIMP CLI。
🔗 项目信息
-
GitHub: https://github.com/HKUDS/CLI-Anything[1] -
CLI-Hub: https://hkuds.github.io/CLI-Anything/hub/[2] -
Star: 2.1k+ ⭐
🎯 总结
CLI-Anything 解决的是一个很实在的问题:
AI Agent 很聪明,但手很短,够不着专业软件。
它用一条命令,把这个差距填平了。
不是玩具,不是 demo,是真正能跑在生产环境里的工具。
今天的软件为人而生,明天的用户是 Agent。
如果你在搞 AI Agent 相关的东西,这个项目值得试试。
引用链接
[1]https://github.com/HKUDS/CLI-Anything
[2]https://hkuds.github.io/CLI-Anything/hub/
夜雨聆风