AI 智能体无法操控专业软件?| CLI-Anything 一键生成 Agent 原生接口(附 7 阶段自动化流程)

现在的软件服务人类,未来的用户将是智能体。
你是否也遇到过这样的场景:想让 AI 帮你批量处理几百张图片,结果它只能在网页版傻瓜工具里打转;想用 Claude 控制本地 Blender 渲染 3D 场景,却因为没有 API 而束手无策?目前的 UI 自动化脆弱不堪,专有 API 封闭难用,所谓的“Agent 工具”往往只是功能的阉割版。
CLI-Anything 就是为了打破这一僵局而生。作为一个强大的 Claude Code 插件,它能够通过 7 阶段全自动流水线,将任何拥有源代码的软件瞬间转化为 AI 智能体可原生控制的 CLI 工具。不再依赖截图识别,不再进行像素级点击,而是直接操作软件核心能力,让 Blender、LibreOffice、GIMP 等专业工具真正成为 Agent 的手脚。
核心功能深挖:从代码到 Agent 的桥梁
CLI-Anything 的核心愿景是让所有软件都具备“Agent 原生”属性。它不仅仅是生成命令行工具,更是构建了一套严密的“软甲”体系。
1. 真实软件集成
市面上很多方案试图用 Pillow 代替 GIMP,用简陋渲染器代替 Blender,但这意味着失去了 90% 的专业能力。CLI-Anything 坚持 零妥协原则:
- 真实渲染:生成合法的项目文件(如 ODF、MLT XML),并委托真实应用程序进行渲染。
- 完整能力:直接对接真实软件后端,保留 100% 的专业功能。
- 原生调用:LibreOffice 生成 PDF,Blender 渲染 3D 场景,Audacity 处理音频。
2. 7 阶段全自动流水线
这不仅是脚本生成,而是完整的软件工程流程。当你输入一条命令,系统会自动执行以下 7 个步骤:
- 🔍 Analyze — 扫描源代码,将 GUI 动作映射为 API。
- 📐 Design — 架构命令组、状态模型和输出格式。
- 🔨 Implement — 构建 Click CLI,包含 REPL、JSON 输出、撤销/重做功能。
- 📋 Plan Tests — 创建 TEST.md,包含单元 + E2E 测试计划。
- 🧪 Write Tests — 实现全面的测试套件。
- 📝 Document — 更新 TEST.md 记录结果。
- 📦 Publish — 创建
setup.py并安装到 PATH。
3. Agent 原生设计
CLI 是人机共用的通用接口,CLI-Anything 为此做了专门优化:
- 结构化输出:内置
--json标志,直接输出机器可读的 JSON,便于 Agent 解析。 - 自描述能力:利用
--help标志,Agent 可以自动发现工具能力。 - 双重交互模式:既支持状态化 REPL 用于交互式会话,也支持子命令接口用于脚本和流水线。
4. 生产级测试覆盖
这不是玩具项目,而是经过实战验证的工业级方案。项目在 11 个复杂应用上进行了测试,涵盖了创意、办公、通讯、图表和 AI 内容生成等领域。
| 软件 | 领域 | 后端技术 | 测试数量 |
|---|---|---|---|
| 🎨 GIMP | 图像编辑 | Pillow + GEGL/Script-Fu | ✅ 107 |
| 🧊 Blender | 3D 建模与渲染 | bpy (Python scripting) | ✅ 208 |
| ✏️ Inkscape | 矢量图形 | Direct SVG/XML manipulation | ✅ 202 |
| 🎵 Audacity | 音频制作 | Python wave + sox | ✅ 161 |
| 📄 LibreOffice | 办公套件 | ODF generation + headless LO | ✅ 158 |
| 📹 OBS Studio | 直播与录制 | JSON scene + obs-websocket | ✅ 153 |
| 🎞️ Kdenlive | 视频剪辑 | MLT XML + melt renderer | ✅ 155 |
| 🎬 Shotcut | 视频剪辑 | Direct MLT XML + melt | ✅ 154 |
| 📞 Zoom | 视频会议 | Zoom REST API (OAuth2) | ✅ 22 |
| 📐 Draw.io | 图表绘制 | mxGraph XML + draw.io CLI | ✅ 138 |
| ✨ AnyGen | AI 内容生成 | AnyGen REST API | ✅ 50 |
| 总计 | ✅ 1,508 |
实战演示:从安装到运行
下面以 Claude Code 为例,展示如何为 GIMP 构建一个 Agent 可用的 CLI。
第一步:安装插件
CLI-Anything 作为 Claude Code 的插件市场分发,安装极其简单:
# 添加 CLI-Anything 市场
/plugin marketplace add HKUDS/CLI-Anything
# 从市场安装 cli-anything 插件
/plugin install cli-anything
第二步:一键构建 CLI
只需一条命令,即可触发完整的 7 阶段构建流程:
# /cli-anything:cli-anything <software-path-or-repo>
# 为 GIMP 生成完整的 CLI(覆盖所有 7 个阶段)
/cli-anything:cli-anything ./gimp
# 注意:如果你的 Claude Code 版本低于 2.x,请使用 "/cli-anything"
第三步:使用生成的 CLI
构建完成后,CLI 会自动安装到你的 PATH 中。你可以直接通过命令行调用,或者让 Agent 去调用它。
# 进入项目目录并安装(如果在构建时未自动安装)
cd gimp/agent-harness && pip install -e .
# 使用帮助查看功能
cli-anything-gimp --help
# 创建新项目
cli-anything-gimp project new --width 1920 --height 1080 -o poster.json
# 添加图层
cli-anything-gimp --json layer add -n "Background" --type solid --color "#1a1a2e"
# 进入交互式 REPL 模式
cli-anything-gimp
避坑指南与总结
在使用 CLI-Anything 时,有几点经验值得注意:
- 模型要求:项目依赖强大的基础模型(如 Claude Opus 4.6, Claude Sonnet 4.6, GPT-5.4)。较弱的模型可能生成不完整或错误的 CLI,需要大量人工修正。
- 源码依赖:7 阶段流水线基于源代码分析。如果目标软件只有需要反编译的二进制文件,生成的 CLI 质量和覆盖率会大幅下降。
- 迭代优化:单次
/cli-anything运行可能无法覆盖所有功能。通常需要运行一次或多次/refine来推动 CLI 达到生产级质量。
CLI-Anything 是迈向“Agent 原生软件”未来的关键一步。如果你是一名开发者,厌倦了为 AI 编写各种繁琐的 Wrapper;或者你是一名 AI 重度用户,希望释放本地专业软件的全部潜力,那么这个项目绝对值得一试。让 AI 不再是“只会聊天的客服”,而是真正能操作专业工具的“超级助手”。
如果你觉得这个项目对你有帮助,不妨去 GitHub 给它一颗 Star ⭐。
GitHub开源地址:https://github.com/HKUDS/CLI-Anything
夜雨聆风