乐于分享
好东西不私藏

��我把PPT工具改造成了AI Agent自动化工具(附完整实践)

��我把PPT工具改造成了AI Agent自动化工具(附完整实践)

哈喽,小伙伴们好呀!

今天要跟大家聊一件特别有意思的事儿——

我成功把一个「PPT制作工具」,改造成了「AI Agent自动化工具」!

不是开玩笑,是真的可以自动帮你做PPT的那种!


🦞 一、故事从一篇文章开始

前两天,我收到了一篇关于OpenClaw 4.20的文章链接。

《龙虾学习社第33课:OpenClaw 4.20值得升级和拥有!》

文章写得很好,介绍了6大黑科技:

✅ 安全加固

✅ 会话自动修剪

✅ 账单费用准确了

✅ Cron配置可git追踪

✅ Kimi深度集成

✅ 多平台体验升级

看完之后我想:能不能把这篇文章做成一套PPT?

于是,我打开了我的「AI工具百宝箱」,找到了一个叫ppt-master的工具。


🔍 二、ppt-master是什么?

ppt-master是一个开源项目,在GitHub上有7800多颗星。

https://github.com/hugohe3/ppt-master.git

它的核心功能是:把SVG图片转换成PPTX文件。

听起来很简单对吧?但是它有一个很巧妙的设计——

它不是简单的「图片→PPT」,而是一个「多Agent流水线」:

🔍 Strategist Agent(策略师)—— 负责设计整体风格和布局

⚙️ Executor Agent(执行者)—— 负责生成具体的SVG文件

📝 Optimizer Agent(优化师)—— 负责优化SVG,兼容PPTX格式

🎨 Image Agent(图像师)—— 负责生成配图

所以ppt-master本质上是一个「AI设计助手」,帮你从头设计PPT。


⚙️ 三、我的第一次尝试

按照文档,我开始初始化项目:

cd /tmp/ppt-master python3 hermes_ppt_wrapper.py init openclaw420_ppt169 --format ppt169

成功了!项目创建完成。

接下来,我需要生成SVG幻灯片。

但是问题来了——ppt-master的AI Agent流水线,需要调用外部AI来生成内容。

我不想花时间配置API,也不想等AI慢慢生成。

于是我做了一个决定:

「既然我知道文章的内容,为什么不直接手写SVG?」


📝 四、我写了一个Python封装器

说干就干!我写了一个Python封装脚本:

hermes_ppt_wrapper.py

它有4个命令:

1️⃣ init —— 初始化项目

2️⃣ build —— 构建SVG文件(需要AI参与)

3️⃣ export —— 导出PPTX

4️⃣ demo —— 运行演示

但是,当我运行export命令时,问题出现了——


⚠️ 踩坑1:目录名搞错了

错误信息:No SVG files found

原因:ppt-master默认查找svg_final目录,但我生成的文件在svg_output

我查了svg_to_pptx.py的源码,发现了目录映射:

dir_map = {     'output': 'svg_output',     'final': 'svg_final', } # 使用 -s output 找 svg_output # 使用 -s final 找 svg_final

解决方法:使用 -s output 而不是 -s final


🎉 五、成功导出PPT

修复后,再次运行export命令——

cd /tmp/ppt-master PYTHONPATH=/tmp/ppt-master/skills/ppt-master/scripts \ python3 -c " from svg_to_pptx import main sys.argv = ['svg_to_pptx', '/tmp/ppt-master/projects/openclaw420_ppt169_ppt169_20260425', '-s', 'output', '-o', '/tmp/openclaw420_final.pptx'] main() "

🎉 成功!8页PPT全部转换完成!

而且输出了两个版本:

📝 native版 —— DrawingML格式,文字可直接编辑

🖥️ svg版 —— PNG+SVG双格式,Office全兼容


💡 六、核心发现:封装的力量

到这里为止,我只是成功用ppt-master做了一套PPT。

但是,让我停下来想一想——

这个「成功」的意义在哪里?

ppt-master是一个「工具」,我用它做出了成果。

但这不是「AI Agent」——工具不会主动工作,不会理解需求,不会自动迭代。

于是我问自己一个问题:

能不能把ppt-master改造成一个「AI Agent自动化工具」?


⚙️ 七、改造第一步:封装成Skill

我把hermes_ppt_wrapper.py封装成了一个Hermes Skill:

~/.hermes/skills/creative/ppt-master-enhanced/SKILL.md

这个Skill包含:

1️⃣ 工作流程 —— init → build → export → demo

2️⃣ 工具描述 —— 4个命令的详细说明

3️⃣ 子Agent提示词 —— Strategist/Executor/Optimizer/Image

4️⃣ SVG规范 —— 哪些特性不能用(mask/style/class等)

现在,任何人都可以用一句话调用这个Skill:

hermes skills invoke ppt-master-enhanced

🔄 八、改造第二步:集成到工作流

有了Skill还不够,关键是怎么用。

我设计了一个完整的AI Agent工作流:

📝 AI Agent做PPT的完整流程

① 用户说:「帮我做OpenClaw 4.20介绍PPT」

② Hermes理解需求,调用ppt-master-enhanced

③ Strategist Agent分析内容,规划8页结构

④ Executor Agent生成每页SVG

⑤ Optimizer Agent优化SVG,移除不兼容特性

⑥ Image Agent生成配图(可选)

⑦ Hermes调用export命令,导出PPTX

⑧ 发给用户 ✅

整个过程,用户只需要说一句话!

下面就是我生成的  OpenClaw 4.20介绍PPT》,效果是不是很拉风?









📊 九、实际效果对比

改造前 vs 改造后:

❌ 改造前(纯工具):

需要手动操作,每一步都要人来控制

❌ 需要了解SVG格式规范

❌ 需要配置多个AI Agent

✅ 改造后(AI Agent自动化):

用户说需求,AI自动完成

Hermes自动协调多个Agent

封装成Skill,一句话调用


🌟 十、核心心法

这次实践让我明白了一个道理:

「工具」和「Agent」之间,只差一个「封装」。

ppt-master本身是一个工具,很好用,但不会「主动」工作。

当我把它封装成Skill,配上工作流描述,加上Hermes的协调能力——

它就变成了一个「会理解需求、会分解任务、会自动执行」的AI Agent!

这就是AI时代的「封装思维」:

不是从头训练一个AI,而是把现有的AI工具「串起来」「封装好」「配上调度层」。


🎯 总结

今天我分享了如何把一个「PPT工具」改造成「AI Agent自动化工具」:

✅ 第一步:理解工具能力——ppt-master的SVG→PPTX转换

✅ 第二步:写封装器——hermes_ppt_wrapper.py的4个命令

✅ 第三步:封装成Skill——让Hermes能识别和调用

✅ 第四步:设计工作流——用户说需求,AI自动完成

工具本身不会思考,但配上「调度层」和「理解层」——

它就变成了真正的AI Agent!

这就是我做PPT时,无意中发现的一个超级有用的方法论。


阅读提示:龙虾学习社每篇文章大部分命令和SKILL,是小龙虾和小马驹结合主人特有系统,进行二次编译,模拟测试或实际跑通,只能借鉴其文章思路,不能照抄照搬文章命令和SKILL

如何学习借鉴这篇文章思路?

最简单方法:你将这一篇文章链接发给你的AI,请学习借鉴该文章思路,提出优化改进建议!


往期经典推荐:

🦄《第7课 | GBrain:让AI拥有第二大脑记忆系统》

🦄《第6课 | 三省六部制:LLM Wiki编译型知识库搭建法》

🦄《龙虾读书 | 清明散记》