乐于分享
好东西不私藏

一个17.5k stars的开源工具,让AI能操控任何专业软件

一个17.5k stars的开源工具,让AI能操控任何专业软件

Agent 很会推理,但一碰到专业软件就傻眼。点不了按钮、调不了参数——这不是 Agent 的问题,是接口的问题。

HKUDS(香港大学数据科学实验室)最近开源了一个工具叫 CLI-Anything,17.5k GitHub stars,解决的就是这件事:把任意软件的源代码丢进去,自动生成 Agent 能调用的命令行接口。


AI 和专业软件打交道,一直就两条老路。

UI 自动化——模拟鼠标点击,界面一改就挂,太脆弱。

官方 API——稳定,但很多软件本来就没有,或者功能覆盖不全。

CLI-Anything 走了第三条路:不改原软件一行代码,直接从源代码里把功能翻译成 Agent 能用的 CLI 命令。

用起来很简单:把源代码扔进去,工具自动分析代码结构、理解参数逻辑、生成标准化接口。

已有验证案例:Audacity(音频)、LibreOffice(办公)、Dify-workflow(AI 流程)。这些软件本来没有统一的 Agent 接口,现在有了。


以前每个专业软件都要单独开发 Agent 接口,耗时耗力。现在一条命令搞定一类问题。

这个方向继续演进的话,Agent 能操控的软件边界会大幅扩展——不只是数字工具,还有 CAD、统计软件、EDA、设计工具……各行各业的专业软件都可能因此被覆盖。

如果你的 Agent 应用需要操控某个没有好 API 的软件,先别急着写 UI 自动化——看看这个软件有没有开源代码,有的话 CLI-Anything 可能让你省掉大量开发工作。

项目地址:github.com/HKUDS/CLI-Anything


你有什么想操控的软件?评论区说说 👇