你有没有想过,让 AI 直接操控PS帮你改一张图、让AI使用剪映帮你剪一段视频?
理论上,AI 现在已经很聪明了。但有一个卡脖子的问题一直没解决:AI 根本不会用软件。它能写代码、能聊天,却打不开 Photoshop、用不了剪映、控制不了 Blender。遇到这类需求,AI 只能干看着。
最近发现一个开源项目,叫 CLI-Anything,专门来解决这个问题。
AI 为什么不会用软件?
这里先说个背景。
我们日常用的软件,几乎都是给人设计的——有按钮、有菜单、要用鼠标点来点去。AI 要操控这类软件,只能通过截图或者rpa的方式来操作,不仅慢,而且极不稳定。
有人尝试过让 AI看截图点按钮,但这种方法既脆弱又低效——界面稍微一变,AI 就懵了。
那有没有更好的办法?
CLI-Anything 的答案是:给每个软件配一套"命令行接口",让 AI 直接发指令操控软件。
比如你想在图片上加一个蓝色背景层,用 Photoshop 你得点七八下;用命令行,就是一句话:
cli-anything-gimp layer add -n "背景" --type solid --color "#1a1a2e"这种方式对 AI 来说非常友好,因为:
• AI 本来就擅长处理文字,命令行全是文字指令 • 结果稳定、可预期,不会因为弹出个对话框就卡住 • 可以像搭积木一样组合,多条指令串起来完成复杂任务
Claude Code每天就是靠命令行完成成千上万个真实任务的。
CLI-Anything 做的事
把任何软件变成 AI 能直接说话操控的工具。
以前,GIMP(开源版 Photoshop)、Blender(3D 建模软件)、LibreOffice(开源 Office)这些功能强大的软件,AI 基本摸不着。CLI-Anything 把它们翻译成了 AI 能理解的语言。
操作方式也极其简单。你把软件的代码扔给它:
/cli-anything ./gimp它会自动分析这个软件的结构,然后生成一套完整的命令行接口。整个过程全自动,分七个阶段完成,从分析源码到生成指令、写测试、打包发布,一气呵成。
目前这个项目已经为 GIMP、Blender、LibreOffice、OBS Studio、Audacity、Inkscape 等 11 款软件生成了完整接口,累计通过了超过 1200 个自动化测试,稳定性有保障。

生成之后,AI 能做什么?
举几个具体例子。
视频剪辑:告诉 AI"把第 30 秒到第 60 秒的片段剪出来,加上字幕",AI 通过 CLI-Anything 直接调用视频软件完成,不需要你动手。
图像处理:让 AI 批量处理一百张图片,统一调整尺寸、加水印,AI 通过命令行一条条指令完成,效率远超手动操作。
文档自动化:生成一份格式规范的报告,AI 直接操控 LibreOffice,比你自己排版还快。
关键是,这些操作调用的是软件真正的功能,不是截图模拟,所以输出质量和人工操作完全一致。
和以前的"AI 操控电脑"有什么不同?
市面上已经有一些让 AI 操控电脑的方案,最常见的是截图+模拟点击,俗称 GUI Agent。
CLI-Anything 和它们最大的区别在于:

这对普通人意味着什么?
短期内,CLI-Anything 主要还是面向开发者和喜欢折腾的技术爱好者。但它打开的是一扇门:
一条命令,就能把为人类设计的软件变成 Agent 的原生工具
未来,你可能只需要用大白话告诉 AI 你想做什么,剩下的——打开软件、找功能、一步步操作——AI 全替你搞定。
GitHub地址:https://github.com/HKUDS/CLI-Anything
欢迎点赞、在看、转发三连。
有问题可以在评论区交流,我会尽量回复。

加我微信进openclaw交流群(备注:龙虾)
夜雨聆风