CLI-Anything:让 AI Agent 掌控一切软件的神器
CLI-Anything:让 AI Agent 掌控一切软件的神器
今天的软件为人类服务,明天的用户将是 AI Agent。
引言
想象一下这样的场景:你对 AI 说”帮我用 Blender 创建一个 3D 场景,添加一个旋转的立方体并渲染成视频”,AI 就能直接调用 Blender 完成这个任务。不需要你手动打开软件、不需要点击菜单、不需要学习复杂的操作界面。
这不再是科幻。CLI-Anything 正在让这个愿景成为现实。
什么是 CLI-Anything?
CLI-Anything 是由**香港大学数据科学实验室(HKUDS)**开发的开源项目,它的核心理念是:通过自动分析软件代码库,为任何软件生成完整的命令行界面(CLI),让 AI Agent 能够原生控制这些软件。
GitHub 地址:https://github.com/HKUDS/CLI-Anything
简单来说,CLI-Anything 就像是一个”万能翻译器”——它能把各种专业软件(如 GIMP、Blender、LibreOffice 等)”翻译”成 AI Agent 能理解和使用的命令行工具。
为什么这很重要?
当前的痛点
现在的 AI Agent 虽然推理能力强大,但在使用真实工具时却面临困境:
- GUI 自动化脆弱 – 基于截图和点击的 RPA 方案经常因为界面微小变化而失效
- API 覆盖有限 – 很多专业软件没有提供完整的 API
- 玩具级实现 – 很多 AI 工具只能做演示,缺乏专业软件的全部功能
CLI-Anything 的解决方案
CLI-Anything 采用了一种更优雅的思路:
- ✅ 直接集成真实软件 – 调用 Blender、LibreOffice、FFmpeg 等专业软件的后端
- ✅ 命令行可靠性 – 无截图、无点击,纯命令行交互,稳定可靠
- ✅ 结构化数据 – 内置 JSON 输出,Agent 易于消费和处理
- ✅ 零妥协 – 保留软件的全部功能,不做任何简化
技术架构:7 阶段生成流程
CLI-Anything 采用了一套精密的 7 阶段流水线来自动生成 CLI:
1️⃣ 分析阶段(Analyze)
扫描软件源码,映射 GUI 操作到内部 API,理解软件的核心功能和数据结构。
2️⃣ 设计阶段(Design)
架构命令分组、设计状态模型、规划输出格式,确保 CLI 的结构合理且易于使用。
3️⃣ 实现阶段(Implement)
基于 Python 的 Click 库构建 CLI,包含 REPL 交互界面、JSON 输出、撤销/重做等功能。
4️⃣ 测试计划(Plan Tests)
创建详细的 TEST.md,规划单元测试和端到端测试场景。
5️⃣ 编写测试(Write Tests)
实现全面的测试套件,确保 CLI 的可靠性。
6️⃣ 文档生成(Document)
自动生成使用文档和 API 参考。
6.5️⃣ SKILL.md 生成(新增)
每个生成的 CLI 都包含 SKILL.md 文件,让 AI Agent 能够自动发现和使用这些工具。
7️⃣ 发布(Publish)
创建 setup.py,将 CLI 打包为可通过 pip 安装的 Python 包。
支持的软件生态
截至目前,CLI-Anything 已经适配了 19+ 款主流软件,涵盖多个领域:
🎨 创意媒体
- GIMP – 专业图像编辑(107 个测试用例)
- Blender – 3D 建模与渲染(208 个测试用例)
- Inkscape – 矢量图形设计(202 个测试用例)
- Krita – 数字绘画
- Shotcut/Kdenlive – 视频剪辑(各 150+ 测试用例)
🎵 音频处理
- Audacity – 音频编辑(161 个测试用例)
- LMMS/Ardour – 音乐制作
📊 生产力办公
- LibreOffice – 办公套件(158 个测试用例)
- Obsidian/Logseq – 知识管理
🤖 AI/ML 平台
- ComfyUI – AI 图像生成(70 个测试用例)
- Ollama – 本地大模型(98 个测试用例)
- Stable Diffusion WebUI – AI 绘画
📞 通信协作
- Zoom – 视频会议(22 个测试用例)
- Mattermost – 团队协作
🌐 网络与基础设施
- AdGuard Home – 网络广告拦截(36 个测试用例)
测试覆盖:总计 1,917 个测试,100% 通过率 ✅
如何使用?
对于 Claude Code 用户
# 添加 CLI-Anything 市场
/plugin marketplace add HKUDS/CLI-Anything
# 安装插件
/plugin install cli-anything
# 一键生成 CLI
/cli-anything ./gimp
对于 OpenClaw 用户
# 安装 skill
openclaw skills install cli-anything
# 使用
@cli-anything build a CLI for ./gimp
生成的 CLI 使用方法
# 安装生成的 CLI
cd gimp/agent-harness && pip install -e .
# 查看帮助
cli-anything-gimp --help
# 创建项目
cli-anything-gimp project new --width 1920 --height 1080 -o poster.json
# 添加图层
cli-anything-gimp --json layer add -n "Background" --type solid --color "#1a1a2e"
# 进入交互式 REPL
cli-anything-gimp
CLI-Hub:社区驱动的 CLI 市场
CLI-Anything 团队还推出了 CLI-Hub(https://hkuds.github.io/CLI-Anything/),这是一个中央注册表:
- 🌐 浏览所有社区构建的 CLI
- 🔍 按类别搜索(创意、办公、AI、开发工具等)
- 📦 一键
pip install安装 - 🤖 Agent 自动发现和安装所需 CLI
更厉害的是,CLI-Anything 还提供了一个 Meta-Skill,让 AI Agent 能够自主浏览 CLI-Hub、发现合适的 CLI 并完成安装——完全无需人工干预!
实际应用场景
场景一:自动化设计工作流
# AI Agent 自动完成:创建海报 → 添加文字 → 导出 PNG
cli-anything-gimp project new -o poster.json
cli-anything-gimp --json layer add-text -t "AI 未来" --font-size 48
cli-anything-gimp --json export render poster.png
场景二:批量文档处理
# AI Agent 自动完成:生成报告 → 插入表格 → 导出 PDF
cli-anything-libreoffice document new -o report.json --type writer
cli-anything-libreoffice --project report.json writer add-table --rows 10 --cols 5
cli-anything-libreoffice --project report.json export render report.pdf -p pdf
场景三:AI 辅助 3D 创作
# AI Agent 自动完成:创建场景 → 添加模型 → 渲染视频
cli-anything-blender scene new -o scene.json
cli-anything-blender --json object add --type cube --name "Main"
cli-anything-blender --json animation rotate -o "360deg" -d 120
cli-anything-blender --json render animation output.mp4
技术亮点
1. 统一的 REPL 体验
所有生成的 CLI 都共享统一的 REPL 界面(ReplSkin),提供一致的品牌化体验:彩色 banner、样式化提示符、命令历史、进度指示器等。
2. 双重交互模式
每个 CLI 都支持两种模式:
- 命令行模式 – 适合脚本和自动化流水线
- REPL 交互模式 – 适合交互式 Agent 会话
3. SKILL.md 自动集成
每个生成的 CLI 都内置 SKILL.md 文件,位于 cli_anything/<software>/skills/SKILL.md。AI Agent 可以通过标准的 --help 和 which 命令发现这些工具。
4. 状态持久化
支持项目状态的持久化存储,以及撤销/重做功能,让复杂的 Agent 工作流更加可靠。
未来展望
CLI-Anything 的愿景是构建一个Agent-Native 的软件生态:
- 🌍 通用访问 – 每个软件都能被 Agent 通过结构化 CLI 控制
- 🔗 无缝集成 – Agent 无需 API、无需 GUI、无需重建即可控制任何应用
- 🚀 面向未来 – 将人类设计的软件转化为 Agent-Native 工具
目前 CLI-Anything 已经支持 Claude Code、OpenClaw、OpenCode、Codex、Qodercli 等平台,团队还在积极适配 Cursor、Windsurf 等更多工具。
总结
CLI-Anything 代表了 AI Agent 工具化的一个重要方向:不是让 Agent 去适应软件,而是让软件变得 Agent-Native。
它通过自动化的代码分析和 CLI 生成,打破了 AI Agent 与专业软件之间的壁垒。无论是创意工作者、开发者还是企业用户,都能从中受益。
如果你正在探索如何让 AI Agent 更好地使用真实工具,CLI-Anything 绝对值得关注和尝试。
项目链接:https://github.com/HKUDS/CLI-Anything
CLI-Hub:https://hkuds.github.io/CLI-Anything/
论文/文档:见 GitHub README
本文介绍了 CLI-Anything 的核心概念、技术架构和应用场景。这个项目正在快速发展,建议关注 GitHub 仓库获取最新动态。
夜雨聆风