乐于分享
好东西不私藏

让任意软件秒变 AI Agent 原生工具,港大这个开源项目暴涨 2万 GitHub Star!

让任意软件秒变 AI Agent 原生工具,港大这个开源项目暴涨 2万 GitHub Star!

港大数据智能实验室(HKUDS)又出爆款了。

这次开源的项目叫 CLI-Anything,上线 5 天 Star 数就冲到 11K,现在已经暴涨近 2 万。同一个实验室之前出过 LightRAG(29K Star)、nanobot(32K Star),这次的增速丝毫不输。

一行命令,把任何开源软件变成 AI Agent 可以直接操控的工具。就这一件事。

/cli-anything ./gimp

跑完,你就有了一个生产级的 GIMP 命令行接口,AI Agent 拿来直接用。

为什么这件事值得近 2 万人点 Star

现在的 AI Agent 有个没人说破的问题:

它能写代码、能查资料、能规划任务,但它用不了你电脑上那些真实的软件

Blender?GIMP?OBS Studio?这些工具都是给人眼+鼠标设计的。Agent 想操作它们,只能走屏幕截图+模拟点击那一套,不稳定、容易崩、稍微换个分辨率或者弹个窗口就断掉,根本没法用于生产。

Andrej Karpathy 说过:“2026 年,建的东西要为 Agent 而建” 但现实是,绝大多数软件的底层设计,压根没考虑过 Agent。

CLI-Anything 的 Slogan 直接点明这个矛盾:

“Today’s Software Serves Humans,Tomorrow’s Users will be Agents。”今天的软件为人而生,明天的用户是 Agent。

一行命令,秒变 Agent 原生工具

CLI-Anything 的做法很直接:读源码,把 GUI 操作全部翻译成命令行接口,顺手生成测试、文档、还有 AI 可以直接读懂的技能定义文件(SKILL.md)

以 Claude Code 为例,三步搞定:

# 第 1 步:安装插件/plugin marketplace add HKUDS/CLI-Anything/plugin install cli-anything# 第 2 步:指向任意项目,一行生成/cli-anything ./gimp# 或者直接丢 GitHub 链接/cli-anything https://github.com/blender/blender![](https://files.mdnice.com/user/105927/82d43a6b-e440-4dee-8cb0-af132c98e1c0.png)# 第 3 步(可选):迭代优化/cli-anything:refine ./gimp "I want more CLIs on image batch processing"

生成完之后,Blender 的 CLI(命令行界面) 用起来长这样:

$ cli-anything-blenderblender> scene new --name ProductShot✓ Created scene: ProductShotblender[ProductShot]> object add-mesh --type cube --location 0 0 1✓ Added mesh: Cube at (0, 0, 1)blender[ProductShot]*> render execute --output render.png --engine CYCLES✓ Rendered: render.png (1920×1080, 2.3 MB)

这不是模拟,是真正在调用 Blender 的渲染引擎。Agent 不需要截图,不需要猜按钮在哪,直接发命令,拿结构化 JSON 结果,继续下一步。

为什么不直接用 MCP 或者 API?

大多数专业桌面软件根本没有 API,GIMP、Inkscape、Audacity、OBS,没有 REST 接口,没有 SDK,以前 Agent 根本进不去。

CLI-Anything 的做法是读源码、理解操作逻辑、然后造一扇门。生成的 CLI 天然带 --json 输出和 --help 自描述,Agent 读完技能文件就知道“我能对它做什么”,不需要提前培训。

顺带一说:这条路只对有源码的开源软件有效。Photoshop、Final Cut Pro 这类闭源工具暂时覆盖不了,用之前要清楚。

目前覆盖 16 款软件,1,800+ 测试全过

已经支持的软件包括:

🖼️ GIMP / ✏️ Inkscape / 🎨 Blender / 🎵 Audacity 📹 OBS Studio / 🎬 Kdenlive / 📄 LibreOffice / 📞 Zoom 🤖 Ollama / 🎨 ComfyUI…

1,800+ 个测试,100% 通过率,调用的是真实软件,不是 mock。

国外开发者圈子反应不小。Threads 上 @aiagents101 说:“15K stars already!? Great idea. CLIs work amazingly well with coding agents.”

Hacker News 上争议四起:有人质疑 token 消耗太高,有人说“Are we reinventing RPC again?”,也有开发者实测说效果比直接用命令行工具好很多。有争议,反而说明方向戳到了真实痛点。

Medium 一篇深度报道直接定性:The problem nobody bothered to solve”,因为之前大家都默认 Agent 用不了桌面软件,没人觉得这是该解决的事。

港大官方 LinkedIn 发帖后,有人在评论区抛出了更大的问题:“GUI 还重要吗?如果未来软件的用户是 Agent,那图形界面对谁设计?”

CLI-Anything 干的事情是:把人类世界的软件基础设施,接入 AI Agent 的世界

这件事如果做成了,Agent 可以真正操作 Blender 渲染、GIMP 修图、OBS 录制、LibreOffice 处理文档,不靠截图点击,不靠重新实现,直接用原版软件。

有点顶。

开源地址:https://github.com/HKUDS/CLI-Anything

都看到这了,关注下吧。

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 让任意软件秒变 AI Agent 原生工具,港大这个开源项目暴涨 2万 GitHub Star!

猜你喜欢

  • 暂无文章