【封神开源神器】一行命令!让AI直接操控,所有软件生态彻底变天了
你敢信?现在告诉AI「用Excel做销售报表+Word写总结+转PDF发客户」,它能直接照办,不用点鼠标、不用碰界面,纯命令行操作完所有步骤!
这不是科幻片的画面,而是香港大学数据科学实验室开发的CLI-Anything做到的事——一个让AI成为所有软件「主人」的开源神器,一行命令,让PS、Blender、LibreOffice等所有软件,都能被AI Agent直接驱动!
GitHub地址:https://github.com/HKUDS/CLI-Anything
短短时间就火遍技术圈,因为它真正实现了:软件的使用者,正从人类,转向AI智能体。
什么是CLI-Anything?AI操控软件的「万能遥控器」
CLI-Anything的核心使命只有一个:让任意软件,都能被AI Agent无缝驱动。
它是一款轻量开源项目,没有复杂的配置,只需要一行命令,就能把Excel、Word、Photoshop、Blender等你电脑里的常用软件,直接变成AI Agent可以调用的命令行工具。
就像给AI配了一套「万能遥控器」,不用再靠脆弱的截图、点击模拟操作软件,而是直接「下达指令」,让软件听AI的话——这是真正的Agent原生软件时代,终于来了!
为什么偏选CLI?人类和AI的「通用万能接口」
很多人会问:为什么是命令行(CLI),而不是更直观的GUI?
答案很简单:CLI是人类和AI Agent共通的万能接口,没有之一!
✅ 结构化、可组合:文本命令完美匹配大模型输入格式,AI能直接理解
✅ 轻量且通用:跨平台运行,电脑几乎零开销,低配机也能用
✅ 自描述:一个--help命令,AI就能自动发现软件所有功能
✅ Agent友好:结构化JSON输出,AI直接消费,不用额外解析
这四大优势,让CLI成为了AI和软件之间「最高效的沟通语言」。
核心杀手锏!一行命令,7阶段全自动流水线
CLI-Anything的操作简单到离谱,以Claude Code为例,三步就能让AI操控任意软件,而核心的生成环节,一行命令就能触发7个阶段的全自动流水线,全程不用人工干预!
三步上手,全程傻瓜式操作
-
1. 安装插件
/plugin marketplace add HKUDS/CLI-Anything/plugin install cli-anything
-
2. 生成CLI
/cli-anything:cli-anything ./gimp
-
3. 直接使用
cd gimp/agent-harness && pip install -e .
cli-anything-gimp --help
一行命令触发的7大全自动阶段
🔍 分析:扫描软件源码,把GUI操作精准映射到API
📐 设计:自动规划命令分组、状态模型、输出格式
🔨 实现:构建Click CLI,自带REPL、JSON输出、撤销/重做
📋 规划测试:根据软件功能,自动生成测试计划
🧪 编写测试:实现完整的测试套件,保障稳定性
📝 文档:自动更新文档,写入所有测试结果
📦 发布:生成setup.py,直接安装到系统PATH,随处可用
所有步骤,一键完成,技术小白也能轻松驾驭!
实测封神!11款专业软件,1508项测试100%通过
这不是一个「玩具项目」,而是经过生产级验证的硬核工具!
CLI-Anything在11款不同领域的复杂软件上完成实测,涵盖创意设计、办公生产力、音视频制作、通信协作等,1508项测试全部通过,通过率100%!
挑几个核心软件给大家看:
🎨 GIMP(图像编辑):107项测试全过
🧊 Blender(3D建模):208项测试全过
📄 LibreOffice(办公套件):158项测试全过
🎵 Audacity(音频制作):161项测试全过
📹 OBS Studio(直播录制):153项测试全过
从设计到办公,从音视频到3D建模,AI能操控的专业软件,已经覆盖了我们工作的方方面面!
手把手实战!用命令行玩转LibreOffice,小白也能会
光说不练假把式,看看CLI-Anything生成的命令行工具,实际怎么操控办公软件——以LibreOffice为例,几步就能完成文档创建、编辑、导出PDF,全程命令行,AI能直接复刻!
# 创建Writer文档
$ cli-anything-libreoffice document new -o report.json --type writer
# 添加一级标题「Q1 Report」
$ cli-anything-libreoffice --project report.json writer add-heading -t "Q1 Report" --level 1
# 添加4行3列表格
$ cli-anything-libreoffice --project report.json writer add-table --rows 4 --cols 3
# 导出为PDF
$ cli-anything-libreoffice --project report.json export render output.pdf -p pdf --overwrite
# 生成JSON信息,供AI直接消费
$ cli-anything-libreoffice --json document info --project report.json
关键是:这个CLI调用的是真实的LibreOffice,不是模拟环境,生成的PDF、文档都是真实可用的,和你手动操作的结果完全一致!
而且所有生成的CLI都支持REPL交互式模式,像聊天一样操控软件,Blender、GIMP都能这么用,体验统一,简单到爆!
三大核心能力,直接颠覆你的工作流
CLI-Anything的厉害,不仅是让AI能操控软件,更在于它能彻底重构你的工作方式,三大核心能力,每一个都戳中职场人的痛点!
🛠️ 让AI完全接管你的工作流
把软件代码库扔给/cli-anything,AI就能用GIMP做设计、Blender做3D、Shotcut剪视频、LibreOffice处理办公——全程自动化,你只需要下达指令。
哪怕没有目标软件的源码,找个开源替代品,照样能用!
🔗 把散装API,统一成一个CLI
受够了一堆零碎的Web服务API?把文档/SDK手册喂给CLI-Anything,AI就能拿到一个有状态、功能完整的CLI,把零散接口整合成逻辑清晰的命令组,不用再挨个调试接口!
🚀 取代脆弱的GUI Agent,让AI操作更稳定
传统GUI自动化,截图、点像素的方式太脆弱,电脑分辨率变了、软件更新了,直接崩掉!
CLI-Anything纯命令行操控,结构化接口,稳定可靠,还能全自动合成Agent任务、评测器,让AI操作软件的效率翻倍!
为什么它是革命性的?直击行业5大痛点
在此之前,AI操控专业软件一直有各种「卡脖子」问题,而CLI-Anything,把这些痛点全解决了!
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
这不是工具的进化,是整个软件生态的革命!
适用场景拉满!从开源项目到企业办公,全覆盖
CLI-Anything不是小众工具,它适用于任何有代码库的软件,覆盖9大核心场景,不管是程序员、设计师、办公族,还是企业运维,都能用得上!
📂 GitHub开源项目:VSCodium、WordPress、Zotero
🤖 AI/ML平台:Stable Diffusion WebUI、ComfyUI
📊 数据与分析:JupyterLab、Apache Superset
💻 开发工具:Jenkins、Gitea、Portainer
🎨 创意与媒体:Blender、GIMP、Audacity、OBS
📐 图表与可视化:Draw.io、Mermaid、PlantUML
🔬 科学计算:ImageJ、FreeCAD、QGIS
🏢 企业与办公:NextCloud、GitLab、LibreOffice
📞 通信与协作:Zoom、Jitsi Meet
目前它已支持Claude Code、OpenCode、Qodercli、Codex等主流AI编程平台,Cursor、Windsurf也即将支持,生态越来越完善!
5分钟快速上手!零门槛让AI操控你的软件
不用怕技术复杂,CLI-Anything的上手门槛极低,满足3个基础环境要求,就能立刻体验:
-
1. Python 3.10+ -
2. 目标软件已安装在电脑 -
3. 拥有Claude Code / OpenCode等AI平台账号
极简体验步骤
# Claude Code用户一键安装插件
/plugin marketplace add HKUDS/CLI-Anything/plugin install cli-anything
# 为任意软件生成CLI,示例为GIMP
/cli-anything:cli-anything ./gimp
# 安装并开始使用
cd gimp/agent-harness && pip install -e .
cli-anything-gimp --help
如果想让CLI功能更完善,还能一键优化:
# 全面优化:分析功能覆盖差距,自动补全
/cli-anything:refine ./gimp
# 定向优化:指定功能领域,比如图像批处理
/cli-anything:refine ./gimp "我需要更多图像批处理和滤镜相关的CLI"
优化是增量、非破坏性的,多次运行能让CLI的功能覆盖越来越全!
一点小局限,不影响它封神
客观说,CLI-Anything目前还有3个小局限,但完全不影响它在当前场景的价值:
-
1. 依赖前沿大模型:需要Claude Opus 4.6、GPT-5.4等强模型,弱模型可能生成不完整CLI -
2. 需要软件源码:基于源码分析生成,二进制软件需反编译,质量会稍降 -
3. 可能需要迭代优化:单次生成不一定覆盖所有功能,需1-2次 refine命令补全
但这些问题,都会随着大模型能力的提升和项目的迭代,逐步解决——它的核心价值,已经完全落地。
未来已来:软件,从「为人而生」到「为AI而生」
CLI-Anything的愿景,是构建Agent原生的软件生态:
🌐 无门槛接入:任何软件都能通过结构化CLI,即刻被Agent操控
🔗 无缝集成:不用专门API、不用操控GUI、不用重构代码,一键对接
🚀 面向未来:一条命令,把为人类设计的软件,变成AI的原生工具
我们正在见证一个时代的转变:过去,所有软件都是为人类的操作习惯设计;未来,软件将为AI Agent而生,而CLI-Anything,就是这场革命的核心桥梁。
今天,你还在手动操作软件;明天,AI就能替你搞定所有步骤,你只需要做「决策者」——这不是遥不可及的未来,而是CLI-Anything已经带来的当下。
互动时间:你最想让AI用CLI操控哪款软件?是PS、Excel,还是Blender、剪映?评论区聊聊,顺便收藏这个封神开源神器,让你的工作流提前进入AI时代!
夜雨聆风