来自香港大学数据智能实验室,20 天斩获 2 万+ Stars,被誉为"AI Agent 掌控全宇宙软件"的革命性工具。
AI 能推理,但不会用工具
CLI-Anything 能做一件事:为任何软件自动生成一套专为 AI Agent 设计的命令行界面(CLI),让 Claude Code、OpenClaw、Codex 等 Agent 像人类用键盘一样,直接、可靠地操控 Blender、GIMP、LibreOffice、OBS Studio 等专业软件。
不是 GUI 自动化截图点击那种脆弱方案,而是直接调用真实软件后端,生产可用。
GitHub: https://github.com/HKUDS/CLI-AnythingCLI-Hub(浏览/安装社区 CLI): https://hkuds.github.io/CLI-Anything/hub/
AI Agent 的真实困境
现在的 AI Agent 越来越擅长推理和规划,但有一道坎一直迈不过去:如何真正操控现有的专业软件?
当你让 Agent 帮你用 Blender 建模、用 GIMP 批处理图片、用 LibreOffice 生成报告时,它面前只有三条路,每条都不好走:
CLI-Anything 给出了第四条路:自动为任何软件生成完整 CLI,直接调用真实后端,零妥协。
为什么偏偏是 CLI?
CLI(命令行界面)天生就是 AI Agent 和软件之间最合适的"通用语言":
结构化、可组合:文本命令完全契合 LLM 的输入输出格式,支持链式调用构建复杂工作流 自我描述: --help自动生成文档,Agent 可以自主发现能力边界结构化输出:内置 --json标志,消除 Agent 的解析负担行为确定可预期:一致的结果让 Agent 可以可靠地规划和执行 零额外依赖:轻量、跨平台,在所有操作系统上开箱即用
Claude Code 每天通过 CLI 跑成千上万个真实工作流,早已验证了这条路的可行性。CLI-Anything 的目标是把这种范式推广到所有软件。
核心机制:全自动 7 阶段流水线
输入一个软件的代码仓库路径,CLI-Anything 自动走完完整的生成流程:
阶段 1 · Analyze 扫描源码,将 GUI 操作映射为底层 API 调用阶段 2 · Design 设计命令分组、状态模型、JSON 输出格式阶段 3 · Implement 基于 Click 构建 CLI(含 REPL、undo/redo、--json 标志)阶段 4 · Plan Tests 自动生成 TEST.md(单元测试 + 端到端测试计划)阶段 5 · Write Tests 实现完整测试套件,覆盖真实软件调用阶段 6 · Document 补充测试结果和命令文档阶段 7 · Publish 生成 setup.py,pip install 后命令直接进 PATH生成之后还可以用 /refine 做增量扩展——自动分析当前 CLI 的功能空白,补充新命令和测试,每次运行都是非破坏性的。
三步快速上手(Claude Code)
第一步:安装插件
/plugin marketplace add HKUDS/CLI-Anything/plugin install cli-anything第二步:为目标软件生成 CLI
# 从本地路径生成/cli-anything:cli-anything ./gimp# 直接从 GitHub 仓库生成/cli-anything:cli-anything https://github.com/blender/blender第三步(可选):增量扩展覆盖面
# 广泛分析,补充所有功能空白/cli-anything:refine ./gimp# 聚焦特定功能方向/cli-anything:refine ./gimp "批量处理和滤镜功能"生成后安装并使用:
# 安装到 PATHcd gimp/agent-harness && pip install -e .# 普通命令行调用cli-anything-gimp project new --width 1920 --height 1080 -o poster.json# JSON 模式(供 Agent 消费)cli-anything-gimp --json layer add -n "Background" --type solid --color "#1a1a2e"# 进入交互式 REPLcli-anything-gimp看看 Agent 真正能做什么
LibreOffice 自动生成报告并导出 PDF:
# 创建 Writer 文档cli-anything-libreoffice document new -o report.json --type writer# 添加标题和表格cli-anything-libreoffice --project report.json writer add-heading -t "Q1 Report" --level 1cli-anything-libreoffice --project report.json writer add-table --rows 4 --cols 3# 调用真实 LibreOffice headless 导出 PDFcli-anything-libreoffice --project report.json export render output.pdf -p pdf --overwrite# ✓ Exported: output.pdf (42,831 bytes) via libreoffice-headlessBlender REPL 交互式 3D 建模:
$ cli-anything-blender╔══════════════════════════════════════════╗║ cli-anything-blender v1.0.0 ║║ Blender CLI for AI Agents ║╚══════════════════════════════════════════╝blender> scene new --name ProductShot✓ Created scene: ProductShotblender[ProductShot]> object add-mesh --type cube --location 0 0 1✓ Added mesh: Cube at (0, 0, 1)blender[ProductShot]*> render execute --output render.png --engine CYCLES✓ Rendered: render.png (1920×1080, 2.3 MB) via blender --background注意最后一行——调用的是真实 Blender 后端渲染出真实 PNG,不是模拟。
已适配 16 款专业软件,1,839 个测试全部通过
cli-anything-gimp | |||
cli-anything-blender | |||
cli-anything-inkscape | |||
cli-anything-audacity | |||
cli-anything-libreoffice | |||
cli-anything-obs-studio | |||
cli-anything-kdenlive | |||
cli-anything-shotcut | |||
cli-anything-drawio | |||
cli-anything-mermaid | |||
cli-anything-comfyui | |||
cli-anything-notebooklm | |||
cli-anything-ollama | |||
cli-anything-adguardhome | |||
cli-anything-zoom | |||
cli-anything-anygen | |||
| 合计 | ✅ 1,839 |
测试分为四个层级:核心函数单元测试、项目文件生成测试、真实软件调用验证(LibreOffice 导出带魔数的真实 PDF、Blender 渲染出实际 PNG),以及 CLI 子进程测试。通过率 100%。
几个值得关注的细节
SKILL.md 自动生成每个 CLI 包内置一个 SKILL.md 技能描述文件。Agent 通过 pip install 自动发现,REPL 启动时直接显示文件路径——无需额外配置,pip install 即可让 Agent 发现并使用这个工具。
CLI-Hub 中央注册表社区贡献的所有 CLI 汇聚在 CLI-Hub,Agent 可以自主浏览、搜索、一键 pip install,真正实现"无 API 也能用"。
坚持调用真实软件后端项目的核心原则之一是"Authentic Software Integration"——CLI 必须调用真实应用程序进行渲染,没有降级方案,没有玩具实现。测试在缺少后端时直接失败(而非跳过),确保功能的真实性。
支持的 Agent 平台
使用前需要了解的局限
依赖前沿大模型:需要 Claude Opus/Sonnet 级别才能保证生成质量,小模型效果会明显下降 需要源代码:7 阶段流水线从源码分析出发;只提供编译二进制的软件,生成质量会大幅降低 可能需要多次精炼:首次生成不一定覆盖全部功能,通常需要跑几次 /refine才能达到生产级别
写在最后
CLI-Anything 来自香港大学数据智能实验室(HKUDS),他们之前还推出过 LightRAG、RAG-Anything 等广受关注的开源项目。项目完全开源(Apache 2.0),欢迎社区贡献新的软件适配。
它提出的核心命题很简单,但影响深远:
今天的软件为人类设计,明天的用户将会是 Agent。CLI-Anything 的使命,就是弥合 AI Agent 与现实软件世界之间的鸿沟。
如果你在构建 AI Agent 工作流,或者希望让某款专业软件变成 Agent 可以直接调用的工具,这个项目值得深入研究。
你最想让哪款软件先变成 Agent CLI?欢迎评论区告诉我。
(比如 Photoshop、Premiere、DaVinci Resolve、VS Code……)
夜雨聆风