最近在用AI的时候,你有没有遇到过这种情况:
想让AI帮忙做个PPT,它只能给你文字建议,你还得自己打开WPS一点点操作。想让AI帮你处理表格数据,它给你写了代码,你还得复制粘贴进Excel手动运行。想让AI帮你修图,它只能教你步骤,你还得自己在PS里一步步操作。
说白了,AI现在就像个出主意的军师,但具体干活还得你自己动手。
这种割裂感,真的让人头大。
直到最近发现了一个GitHub项目,彻底解决了这个痛点。项目名叫harness-anything,开源半个月就引起了不少开发者的关注。

项目简介
harness-anything是一个AI Agent工具集,核心功能就一句话:让AI直接操控你电脑上的办公软件、设计软件。
不用你再当"人肉翻译",AI说的话直接变成软件操作。
项目包含4大模块:
WPS/Office操控(47个CLI命令) Zotero学术研究(27个学术Skill) Adobe Illustrator操控 Adobe Photoshop操控
作者是个很务实的开发者,整个项目基于Windows COM接口开发,通过Python命令行工具实现。也就是说,它不是那种玩具级的Demo,而是真正能在你电脑上跑起来的生产力工具。
核心功能
WPS/Office操控:47个CLI命令覆盖全流程
这个模块能干什么?
Writer(文档):段落、标题、列表、表格、图片、查找替换、字体样式,该有的都有。
Calc(表格):工作表管理、单元格读写、公式计算、合并单元格、批量填充,数据处理全搞定。
Impress(PPT):幻灯片增删改、文本框、形状、背景、导出,还内置了4套预设主题+14种布局+5维度质量审查。
更妙的是,它支持导出成DOCX、XLSX、PPTX、PDF、TXT、HTML、CSV、RTF等各种格式。你用WPS做完,想导出成Office格式分享给同事,一条命令搞定。
Zotero学术研究:27个Skill一站式搞定论文
这个模块是给做学术研究的朋友准备的。
把文献管理和学术工作流深度整合,分成7大类别:
search(3个Skill):快速检索、系统评价、深度文献搜索 research(4个Skill):创意生成、头脑风暴、假设验证、深度研究 writing(5个Skill):写论文、IMRAD稿件、引用管理、大纲生成、修改润色 review(5个Skill):5人审稿、同行评审、七轮对抗、引用验证 visualization(4个Skill):幻灯片、示意图、海报、期刊图表 analysis(3个Skill):探索分析、统计检验、证据评估 pipeline(2个Skill):完整学术流水线、研究到论文全流程
比如你要写综述,直接运行cli-anything-zotero skills pipeline thesis,它会推荐整套流程。要了解Nature期刊的图表规范,运行cli-anything-zotero skills journal "Nature",规范直接给你。
Adobe Illustrator/Photoshop操控
这两个模块的思路一样,都是通过COM接口操控Adobe软件。
Illustrator模块能做什么:
新建/打开/保存AI文档 图层增删改、可见性、锁定 绘制矩形、椭圆、线条、多边形 添加文字、修改字体大小颜色 导出PNG/JPEG/SVG/PDF/AI
Photoshop模块能做什么:
新建/打开/保存PSD文档 文档属性调整(尺寸、分辨率、色彩模式) 图层操作(增删改、透明度、混合模式) 选区操作(全选、羽化、反选、扩展) 图像调整(裁切、旋转、翻转、画布大小) 文字图层管理 导出PNG/JPEG/WebP/PSD 滤镜操作
技术亮点
这个项目最厉害的地方,是它用COM自动化接口实现了对闭源软件的操控。
WPS、Office、PS、AI这些软件都不开放源代码,但它们都支持COM接口(一种Windows平台的组件对象模型)。作者就是抓住这个点,用Python的pywin32库调用COM接口,实现了命令行操控。
这意味着什么?
你的AI Agent只要能调用命令行工具,就能直接操控这些软件。不需要软件官方提供API,不需要安装额外插件,只要你电脑上装了这些软件,就能用。
而且所有操作都是本地执行,不需要把文件上传到云端,隐私安全完全可控。
快速上手
安装很简单:
# WPS办公pip install git+https://github.com/yb2460/cli-anything-wps.git# Illustrator操控cd illustrator-harness/agent-harnesspip install -e .# Photoshop操控 cd photoshop-harness/agent-harnesspip install -e .使用示例:
# WPS创建PPT并导出cli-anything-wps document new --type impress --name "演示"cli-anything-wps preset apply academic --talk-type defensecli-anything-wps export render output.pptx -p pptx# Zotero学术流程cli-anything-zotero skills pipeline thesiscli-anything-zotero catalog search "machine learning"# Illustrator设计cli-anything-illustrator project new logo.ai -w 500 -h 500cli-anything-illustrator shapes rect --w 200 --h 200# Photoshop设计cli-anything-photoshop project new banner.psd -w 1920 -h 1080cli-anything-photoshop export png banner.png系统要求:
Windows 10/11 WPS Office 2019+或Microsoft Office 2016+ Adobe Illustrator 2023+(可选) Adobe Photoshop 2023+(可选) Python 3.10+ + pywin32
需要注意的是,COM接口和Microsoft Office VBA完全兼容。如果你用的是MS Office而不是WPS,只需要把代码里的ProgID改成PowerPoint.Application、Word.Application、Excel.Application就能用。
适合谁用
如果你是这几类人,强烈建议试试:
AI自动化开发者:正在开发AI Agent,需要让AI操控办公软件的,这个项目能省你几周的开发时间。
效率工具爱好者:想用AI提升办公效率,但又不想手动复制粘贴AI的建议,这个工具能让AI直接干活。
学术研究人员:经常用Zotero管理文献,写论文、做图表、投稿,这套学术Skill能覆盖你80%的工作流。
设计师:想让AI帮忙批量处理设计任务,比如批量生成图标、批量修图、批量导出,有了这个工具就能自动化了。
写在最后
AI时代的生产力革命,不是让AI帮你出主意,而是让AI真正动手干活。
harness-anything这个项目,本质上是在做一件事:打通AI的大脑和软件的手。
现在它已经开源了,MIT协议,你可以直接用,也可以基于它二次开发。
GitHub地址:https://github.com/yb2460/harness-anything
如果你正在探索AI提效的路径,这个项目值得花时间研究一下。
夜雨聆风