乐于分享
好东西不私藏

今天的软件服务人类,明天的软件用户是AI?港大团队搞了个骚操作,让所有都成了的“手脚”

今天的软件服务人类,明天的软件用户是AI?港大团队搞了个骚操作,让所有都成了的“手脚”

今天的软件是为人设计的,而未来的软件是为AI设计的这是团队的设计理念,所以他们开发了:CLI-Anything,上线几天,GitHub Trending榜上有名,星标蹭蹭往上涨。

这玩意儿到底是啥?

一句话:给软件装上AI能看懂的操作系统

它不是又一个让你“聊聊天”的AI工具,而是一个翻译官——把你电脑上那些专业软件(GIMP、Blender、LibreOffice、OBS……)翻译成AI能直接调用的“命令”。

翻译完之后,你让AI“把这张图调成暖色调”,它不用学怎么用鼠标点菜单,直接敲一行命令就搞定:

回车,图修好了。

这玩意儿为啥突然火了?

因为痛点太痛了

以前想让AI操作软件,只有两条路:

第一条:GUI自动化——让AI学人用鼠标,截图、识别按钮、模拟点击。听着挺高级,实际用起来……一个弹窗、一次版本升级、甚至窗口大小变了,都能让它当场崩溃。

第二条:重新开发——给每个软件单独写一套API,让AI调。但这等于让每个软件商都给自己产品“砍掉重练”,成本高到离谱,基本不可能。

CLI-Anything走了第三条路:不改软件,只改接口

它把软件那些藏在底层的功能,直接暴露成一行行命令。AI不用看屏幕、不用点鼠标,敲命令就能干活。

举个栗子:让AI帮你做PPT

假设你要做一份季度汇报PPT,以前得自己开LibreOffice,一页一页调格式。现在呢?

这里只是简单的举个例子,如果想要详细了解CLI-Anything 会做什么?CLI-Anything 如何是工作的?核心原理是什么?可以自行去访问Github地址,里面有很详细的介绍。

怎么玩?三步上手

这项目是给Claude Code做的插件,如果你在用Claude,装起来特简单:

有啥坑?我也得说实话

⚠️ 目前只支持开源软件因为要分析源码才能生成CLI,闭源软件暂时没辙。像Photoshop、Final Cut这些,还得等等。

⚠️ 需要Claude Code环境目前是作为Claude的插件分发,如果你不用Claude,上手会麻烦点。不过团队说后续会支持更多Agent框架。

⚠️ 不是100%完美有技术大佬实测发现,部分功能还是有点小bug,比如依赖不全、参数细节容易翻车。但方向是对的,而且团队更新贼快。

最后说两句

我特别喜欢这个项目的slogan:

“Today‘s Software Serves Humans. Tomorrow’s Users will be Agents.”今天的软件服务人类,明天的用户是AI。

想想挺有意思的。以前我们设计软件,是给人用的——要有好看的界面、顺手的交互。但未来的“用户”,可能不是人,是AI。

AI不需要好看的按钮,它需要的是能直接调用的接口。

CLI-Anything做的,就是帮今天的软件,提前适应明天的用户

如果你也想让自己的AI从“只会聊天”进化到“真能干活”,不妨去GitHub上看看这个项目。

项目地址:https://github.com/HKUDS/CLI-Anything


对了,你最想让AI帮你操作哪个软件?留言告诉我,说不定下个版本就有了~