乐于分享
好东西不私藏

给软件穿上"AI 外套":CLI-Anything 如何让任何程序都能被 控制

给软件穿上"AI 外套":CLI-Anything 如何让任何程序都能被 控制

之前我们介绍了 OpenAI 提出的 Harness Engineering(点击蓝字回顾),核心观点是:不要写更好的提示词,而是设计更好的环境

今天给大家介绍两个基于这个理念的开源工具——CLI-AnythingOpenAI Codex CLI,它们做的事情非常酷:让任何软件都能被 AI 控制


🤖 为什么需要”AI 化”软件?

现在的软件都是给人用的,有图形界面(GUI)。但问题是:AI Agent 看不懂 GUI 啊!

AI agent 只能读文本、跑命令行。你让它操作 Photoshop?对不起,AI 看不到你鼠标点击的是哪个按钮。

所以问题的关键是:怎么让 AI 也能操作那些原本为人类设计的软件?

答案来了:CLI-Anything


🔧 CLI-Anything:一条命令,给软件穿上”AI 外套”

CLI-Anything 是一个开源项目(GitHub: HKUDS/CLI-Anything),它的 slogan 非常霸气:

“Making ALL Software Agent-Native”

翻译过来就是:让所有软件都变成 AI 原生

一句话解释

你给它任何一个软件(甚至是一段源代码),它能自动生成一个命令行接口(CLI),让 AI Agent 能够通过命令行来控制这个软件。

支持哪些软件?

目前已经支持一大票常用工具:

  • 🎨 GIMP(图像编辑器)
  • 🎬 Blender(3D 建模)
  • 📄 LibreOffice(办公套件)
  • 🎥 Shotcut(视频编辑)
  • 📹 Zoom(视频会议)
  • …等等

而且还在快速增加中!

怎么用?

一步到位:

# 给 GIMP 创建一个 CLI
/cli-anything ./gimp

这就是它的全部操作。运行后,CLI-Anything 会自动:

  1. 🔍 分析 — 扫描源代码/软件功能
  2. 📐 设计 — 规划命令行参数结构
  3. 🔨 实现 — 用 Click 框架构建完整 CLI
  4. 🧪 测试 — 生成单元测试和端到端测试
  5. 📝 文档 — 自动生成使用文档
  6. 📦 发布 — 打包成可安装的 Python 包

能做什么?

生成出来的 CLI 支持:

  • 完整的子命令 — 每个软件功能都有对应的命令
  • JSON 输出 — AI 最爱,结构化好解析
  • REPL 交互模式 — 随时进入交互式命令行
  • 撤销/重做 — 后悔药
  • 帮助文档 — 自带 –help,AI 可以自己发现能力

例子:GIMP 的 CLI 能做什么?

# 打开图片
gimp-cli open /path/to/image.png

# 调整亮度
gimp-cli adjust brightness --value 20

# 应用滤镜
gimp-cli filter blur --radius 5

# 导出
gimp-cli export --format jpg --output ./output.jpg

AI 只需要说一句”把这张图调亮 20%,然后加上模糊滤镜”,CLI-Anything 生成的工具就能自动完成。


🐍 GUI-Anything:还有进阶版!

就在 CLI-Anything 火起来之后,社区又搞出了 GUI-Anything

如果说 CLI-Anything 是给软件穿上”命令行外套”,那 GUI-Anything 就是给它穿上”图形界面外套”。

核心功能:

  • 把任何软件自动变成一个 Web GUI
  • 同时暴露 MCP 工具 给 AI Agent 控制
  • 一套代码,同时支持 Web → Desktop → Mobile

这就很离谱了——以后让 AI 帮你操作软件,连命令行都不用看了,直接看 GUI!


☁️ OpenAI Codex CLI:官方亲儿子

说完社区项目,不得不提 OpenAI Codex CLI——OpenAI 官方出的 AI 编程 CLI 工具。

这是 OpenAI 在 2025 年推出的产品,专门给开发者用来在终端里做 AI 编程。

核心能力:

  • 📝 代码生成 — 终端里直接写代码
  • 🔍 代码审查 — AI 帮你 review
  • 🐛 Bug 修复 — 自动修 bug
  • 📦 项目构建 — 帮你搭建项目结构

配合 Harness Engineering 使用,OpenAI 团队实现了 0 行手写代码,5 个月产出 100 万行代码 的壮举。


🔗 三者关系:生态来了

现在的 AI 开发工具链正在快速形成:

Harness Engineering(方法论)
    ↓
    ├── CLI-Anything(社区工具 → 给软件穿 CLI 外套)
    │       ↓
    │       └── GUI-Anything(进阶 → 再加个 GUI 外套)
    │
    └── Codex CLI(官方工具 → AI 编程本体)

核心思路都是一样的:让 AI 能”看到”和”操作”软件


🤔 这意味着什么?

过去我们说”软件自动化”,主要指:

  • 定时跑脚本
  • CI/CD 自动化流程

现在 AI Agent 时代 的自动化变成了:

  • 让 AI 直接操作任何软件
  • 一句话完成复杂任务

比如:

  • “帮我把这 100 张图片批量调亮,然后加上水印”
  • “把这段视频剪成 1 分钟,配上背景音乐”
  • “打开 Excel,汇总这个月的销售数据”

以前需要写 Python 脚本、查文档、调 API——现在只需要说一句话


📚 资料链接

  • CLI-Anything GitHub: https://github.com/HKUDS/CLI-Anything[1]
  • GUI-Anything GitHub: https://github.com/ImL1s/GUI-Anything[2]
  • CLI-Hub 工具市场: https://hkuds.github.io/CLI-Anything/hub/[3]
  • OpenAI Harness Engineering: https://openai.com/index/harness-engineering/[4]

📣 关注「小杜讲AI」

专注分享 AI 前沿技术、行业洞察与工具实践。
每周带你了解一个改变开发方式的 AI 新概念。
微信号:HNUDumin

引用链接

[1]https://github.com/HKUDS/CLI-Anything

[2]https://github.com/ImL1s/GUI-Anything

[3]https://hkuds.github.io/CLI-Anything/hub/

[4]https://openai.com/index/harness-engineering/

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 给软件穿上"AI 外套":CLI-Anything 如何让任何程序都能被 控制

猜你喜欢

  • 暂无文章