给软件穿上"AI 外套":CLI-Anything 如何让任何程序都能被 控制
之前我们介绍了 OpenAI 提出的 Harness Engineering(点击蓝字回顾),核心观点是:不要写更好的提示词,而是设计更好的环境。
今天给大家介绍两个基于这个理念的开源工具——CLI-Anything 和 OpenAI Codex CLI,它们做的事情非常酷:让任何软件都能被 AI 控制。
🤖 为什么需要”AI 化”软件?
现在的软件都是给人用的,有图形界面(GUI)。但问题是:AI Agent 看不懂 GUI 啊!
AI agent 只能读文本、跑命令行。你让它操作 Photoshop?对不起,AI 看不到你鼠标点击的是哪个按钮。
所以问题的关键是:怎么让 AI 也能操作那些原本为人类设计的软件?
答案来了:CLI-Anything。
🔧 CLI-Anything:一条命令,给软件穿上”AI 外套”
CLI-Anything 是一个开源项目(GitHub: HKUDS/CLI-Anything),它的 slogan 非常霸气:
“Making ALL Software Agent-Native”
翻译过来就是:让所有软件都变成 AI 原生。
一句话解释
你给它任何一个软件(甚至是一段源代码),它能自动生成一个命令行接口(CLI),让 AI Agent 能够通过命令行来控制这个软件。
支持哪些软件?
目前已经支持一大票常用工具:
-
🎨 GIMP(图像编辑器) -
🎬 Blender(3D 建模) -
📄 LibreOffice(办公套件) -
🎥 Shotcut(视频编辑) -
📹 Zoom(视频会议) -
…等等
而且还在快速增加中!
怎么用?
一步到位:
# 给 GIMP 创建一个 CLI
/cli-anything ./gimp
这就是它的全部操作。运行后,CLI-Anything 会自动:
-
🔍 分析 — 扫描源代码/软件功能 -
📐 设计 — 规划命令行参数结构 -
🔨 实现 — 用 Click 框架构建完整 CLI -
🧪 测试 — 生成单元测试和端到端测试 -
📝 文档 — 自动生成使用文档 -
📦 发布 — 打包成可安装的 Python 包
能做什么?
生成出来的 CLI 支持:
-
✅ 完整的子命令 — 每个软件功能都有对应的命令 -
✅ JSON 输出 — AI 最爱,结构化好解析 -
✅ REPL 交互模式 — 随时进入交互式命令行 -
✅ 撤销/重做 — 后悔药 -
✅ 帮助文档 — 自带 –help,AI 可以自己发现能力
例子:GIMP 的 CLI 能做什么?
# 打开图片
gimp-cli open /path/to/image.png
# 调整亮度
gimp-cli adjust brightness --value 20
# 应用滤镜
gimp-cli filter blur --radius 5
# 导出
gimp-cli export --format jpg --output ./output.jpg
AI 只需要说一句”把这张图调亮 20%,然后加上模糊滤镜”,CLI-Anything 生成的工具就能自动完成。
🐍 GUI-Anything:还有进阶版!
就在 CLI-Anything 火起来之后,社区又搞出了 GUI-Anything!
如果说 CLI-Anything 是给软件穿上”命令行外套”,那 GUI-Anything 就是给它穿上”图形界面外套”。
核心功能:
-
把任何软件自动变成一个 Web GUI -
同时暴露 MCP 工具 给 AI Agent 控制 -
一套代码,同时支持 Web → Desktop → Mobile
这就很离谱了——以后让 AI 帮你操作软件,连命令行都不用看了,直接看 GUI!
☁️ OpenAI Codex CLI:官方亲儿子
说完社区项目,不得不提 OpenAI Codex CLI——OpenAI 官方出的 AI 编程 CLI 工具。
这是 OpenAI 在 2025 年推出的产品,专门给开发者用来在终端里做 AI 编程。
核心能力:
-
📝 代码生成 — 终端里直接写代码 -
🔍 代码审查 — AI 帮你 review -
🐛 Bug 修复 — 自动修 bug -
📦 项目构建 — 帮你搭建项目结构
配合 Harness Engineering 使用,OpenAI 团队实现了 0 行手写代码,5 个月产出 100 万行代码 的壮举。
🔗 三者关系:生态来了
现在的 AI 开发工具链正在快速形成:
Harness Engineering(方法论)
↓
├── CLI-Anything(社区工具 → 给软件穿 CLI 外套)
│ ↓
│ └── GUI-Anything(进阶 → 再加个 GUI 外套)
│
└── Codex CLI(官方工具 → AI 编程本体)
核心思路都是一样的:让 AI 能”看到”和”操作”软件。
🤔 这意味着什么?
过去我们说”软件自动化”,主要指:
-
定时跑脚本 -
CI/CD 自动化流程
现在 AI Agent 时代 的自动化变成了:
-
让 AI 直接操作任何软件 -
一句话完成复杂任务
比如:
-
“帮我把这 100 张图片批量调亮,然后加上水印” -
“把这段视频剪成 1 分钟,配上背景音乐” -
“打开 Excel,汇总这个月的销售数据”
以前需要写 Python 脚本、查文档、调 API——现在只需要说一句话。
📚 资料链接
-
CLI-Anything GitHub: https://github.com/HKUDS/CLI-Anything[1] -
GUI-Anything GitHub: https://github.com/ImL1s/GUI-Anything[2] -
CLI-Hub 工具市场: https://hkuds.github.io/CLI-Anything/hub/[3] -
OpenAI Harness Engineering: https://openai.com/index/harness-engineering/[4]
📣 关注「小杜讲AI」
专注分享 AI 前沿技术、行业洞察与工具实践。
每周带你了解一个改变开发方式的 AI 新概念。
微信号:HNUDumin
引用链接
[1]https://github.com/HKUDS/CLI-Anything
[2]https://github.com/ImL1s/GUI-Anything
[3]https://hkuds.github.io/CLI-Anything/hub/
[4]https://openai.com/index/harness-engineering/
夜雨聆风