今天的软件服务人类,明天的软件用户是AI?港大团队搞了个骚操作,让所有都成了的“手脚”

这玩意儿到底是啥?
一句话:给软件装上AI能看懂的操作系统。
它不是又一个让你“聊聊天”的AI工具,而是一个翻译官——把你电脑上那些专业软件(GIMP、Blender、LibreOffice、OBS……)翻译成AI能直接调用的“命令”。
翻译完之后,你让AI“把这张图调成暖色调”,它不用学怎么用鼠标点菜单,直接敲一行命令就搞定:

回车,图修好了。
这玩意儿为啥突然火了?
因为痛点太痛了。
以前想让AI操作软件,只有两条路:
第一条:GUI自动化——让AI学人用鼠标,截图、识别按钮、模拟点击。听着挺高级,实际用起来……一个弹窗、一次版本升级、甚至窗口大小变了,都能让它当场崩溃。
第二条:重新开发——给每个软件单独写一套API,让AI调。但这等于让每个软件商都给自己产品“砍掉重练”,成本高到离谱,基本不可能。
CLI-Anything走了第三条路:不改软件,只改接口。
它把软件那些藏在底层的功能,直接暴露成一行行命令。AI不用看屏幕、不用点鼠标,敲命令就能干活。
举个栗子:让AI帮你做PPT

这里只是简单的举个例子,如果想要详细了解CLI-Anything 会做什么?CLI-Anything 如何是工作的?核心原理是什么?可以自行去访问Github地址,里面有很详细的介绍。
怎么玩?三步上手
这项目是给Claude Code做的插件,如果你在用Claude,装起来特简单:

有啥坑?我也得说实话
⚠️ 目前只支持开源软件因为要分析源码才能生成CLI,闭源软件暂时没辙。像Photoshop、Final Cut这些,还得等等。
⚠️ 需要Claude Code环境目前是作为Claude的插件分发,如果你不用Claude,上手会麻烦点。不过团队说后续会支持更多Agent框架。
⚠️ 不是100%完美有技术大佬实测发现,部分功能还是有点小bug,比如依赖不全、参数细节容易翻车。但方向是对的,而且团队更新贼快。
最后说两句
我特别喜欢这个项目的slogan:
“Today‘s Software Serves Humans. Tomorrow’s Users will be Agents.”(今天的软件服务人类,明天的用户是AI。)
想想挺有意思的。以前我们设计软件,是给人用的——要有好看的界面、顺手的交互。但未来的“用户”,可能不是人,是AI。
AI不需要好看的按钮,它需要的是能直接调用的接口。
CLI-Anything做的,就是帮今天的软件,提前适应明天的用户。
如果你也想让自己的AI从“只会聊天”进化到“真能干活”,不妨去GitHub上看看这个项目。
项目地址:https://github.com/HKUDS/CLI-Anything
对了,你最想让AI帮你操作哪个软件?留言告诉我,说不定下个版本就有了~
夜雨聆风