乐于分享
好东西不私藏

AI 智能体无法操控专业软件?| CLI-Anything 一键生成 Agent 原生接口(附 7 阶段自动化流程)

本文最后更新于2026-03-13,某些文章具有时效性,若有错误或已失效,请在下方留言或联系老夜

AI 智能体无法操控专业软件?| CLI-Anything 一键生成 Agent 原生接口(附 7 阶段自动化流程)

现在的软件服务人类,未来的用户将是智能体。

你是否也遇到过这样的场景:想让 AI 帮你批量处理几百张图片,结果它只能在网页版傻瓜工具里打转;想用 Claude 控制本地 Blender 渲染 3D 场景,却因为没有 API 而束手无策?目前的 UI 自动化脆弱不堪,专有 API 封闭难用,所谓的“Agent 工具”往往只是功能的阉割版。

CLI-Anything 就是为了打破这一僵局而生。作为一个强大的 Claude Code 插件,它能够通过 7 阶段全自动流水线,将任何拥有源代码的软件瞬间转化为 AI 智能体可原生控制的 CLI 工具。不再依赖截图识别,不再进行像素级点击,而是直接操作软件核心能力,让 Blender、LibreOffice、GIMP 等专业工具真正成为 Agent 的手脚。

核心功能深挖:从代码到 Agent 的桥梁

CLI-Anything 的核心愿景是让所有软件都具备“Agent 原生”属性。它不仅仅是生成命令行工具,更是构建了一套严密的“软甲”体系。

1. 真实软件集成

市面上很多方案试图用 Pillow 代替 GIMP,用简陋渲染器代替 Blender,但这意味着失去了 90% 的专业能力。CLI-Anything 坚持 零妥协原则

  • 真实渲染:生成合法的项目文件(如 ODF、MLT XML),并委托真实应用程序进行渲染。
  • 完整能力:直接对接真实软件后端,保留 100% 的专业功能。
  • 原生调用:LibreOffice 生成 PDF,Blender 渲染 3D 场景,Audacity 处理音频。

2. 7 阶段全自动流水线

这不仅是脚本生成,而是完整的软件工程流程。当你输入一条命令,系统会自动执行以下 7 个步骤:

  1. 🔍 Analyze — 扫描源代码,将 GUI 动作映射为 API。
  2. 📐 Design — 架构命令组、状态模型和输出格式。
  3. 🔨 Implement — 构建 Click CLI,包含 REPL、JSON 输出、撤销/重做功能。
  4. 📋 Plan Tests — 创建 TEST.md,包含单元 + E2E 测试计划。
  5. 🧪 Write Tests — 实现全面的测试套件。
  6. 📝 Document — 更新 TEST.md 记录结果。
  7. 📦 Publish — 创建 setup.py 并安装到 PATH。

3. Agent 原生设计

CLI 是人机共用的通用接口,CLI-Anything 为此做了专门优化:

  • 结构化输出:内置 --json 标志,直接输出机器可读的 JSON,便于 Agent 解析。
  • 自描述能力:利用 --help 标志,Agent 可以自动发现工具能力。
  • 双重交互模式:既支持状态化 REPL 用于交互式会话,也支持子命令接口用于脚本和流水线。

4. 生产级测试覆盖

这不是玩具项目,而是经过实战验证的工业级方案。项目在 11 个复杂应用上进行了测试,涵盖了创意、办公、通讯、图表和 AI 内容生成等领域。

软件 领域 后端技术 测试数量
🎨 GIMP 图像编辑 Pillow + GEGL/Script-Fu ✅ 107
🧊 Blender 3D 建模与渲染 bpy (Python scripting) ✅ 208
✏️ Inkscape 矢量图形 Direct SVG/XML manipulation ✅ 202
🎵 Audacity 音频制作 Python wave + sox ✅ 161
📄 LibreOffice 办公套件 ODF generation + headless LO ✅ 158
📹 OBS Studio 直播与录制 JSON scene + obs-websocket ✅ 153
🎞️ Kdenlive 视频剪辑 MLT XML + melt renderer ✅ 155
🎬 Shotcut 视频剪辑 Direct MLT XML + melt ✅ 154
📞 Zoom 视频会议 Zoom REST API (OAuth2) ✅ 22
📐 Draw.io 图表绘制 mxGraph XML + draw.io CLI ✅ 138
✨ AnyGen AI 内容生成 AnyGen REST API ✅ 50
总计 ✅ 1,508

实战演示:从安装到运行

下面以 Claude Code 为例,展示如何为 GIMP 构建一个 Agent 可用的 CLI。

第一步:安装插件

CLI-Anything 作为 Claude Code 的插件市场分发,安装极其简单:

# 添加 CLI-Anything 市场
/plugin marketplace add HKUDS/CLI-Anything

# 从市场安装 cli-anything 插件
/plugin install cli-anything

第二步:一键构建 CLI

只需一条命令,即可触发完整的 7 阶段构建流程:

# /cli-anything:cli-anything <software-path-or-repo>
# 为 GIMP 生成完整的 CLI(覆盖所有 7 个阶段)
/cli-anything:cli-anything ./gimp

# 注意:如果你的 Claude Code 版本低于 2.x,请使用 "/cli-anything"

第三步:使用生成的 CLI

构建完成后,CLI 会自动安装到你的 PATH 中。你可以直接通过命令行调用,或者让 Agent 去调用它。

# 进入项目目录并安装(如果在构建时未自动安装)
cd gimp/agent-harness && pip install -e .

# 使用帮助查看功能
cli-anything-gimp --help

# 创建新项目
cli-anything-gimp project new --width 1920 --height 1080 -o poster.json

# 添加图层
cli-anything-gimp --json layer add -n "Background" --type solid --color "#1a1a2e"

# 进入交互式 REPL 模式
cli-anything-gimp

避坑指南与总结

在使用 CLI-Anything 时,有几点经验值得注意:

  1. 模型要求:项目依赖强大的基础模型(如 Claude Opus 4.6, Claude Sonnet 4.6, GPT-5.4)。较弱的模型可能生成不完整或错误的 CLI,需要大量人工修正。
  2. 源码依赖:7 阶段流水线基于源代码分析。如果目标软件只有需要反编译的二进制文件,生成的 CLI 质量和覆盖率会大幅下降。
  3. 迭代优化:单次 /cli-anything 运行可能无法覆盖所有功能。通常需要运行一次或多次 /refine 来推动 CLI 达到生产级质量。

CLI-Anything 是迈向“Agent 原生软件”未来的关键一步。如果你是一名开发者,厌倦了为 AI 编写各种繁琐的 Wrapper;或者你是一名 AI 重度用户,希望释放本地专业软件的全部潜力,那么这个项目绝对值得一试。让 AI 不再是“只会聊天的客服”,而是真正能操作专业工具的“超级助手”。

如果你觉得这个项目对你有帮助,不妨去 GitHub 给它一颗 Star ⭐。

GitHub开源地址:https://github.com/HKUDS/CLI-Anything

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » AI 智能体无法操控专业软件?| CLI-Anything 一键生成 Agent 原生接口(附 7 阶段自动化流程)

猜你喜欢

  • 暂无文章