乐于分享
好东西不私藏

巧夺天工:OpenClaw/Hermes写PPT实战

巧夺天工:OpenClaw/Hermes写PPT实战

导读

最近我实测了 GitHub 上比较火的几款 PPT 技能,用同一个提示词逐个跑了一遍,有些能用,有些半成品,有些惊艳。今天把实测情况说一下,供参考。 这些技能既能在 OpenClaw 里用,也能在 Hermes 里用——两个 Agent 生态共享技能库,选哪个都能跑。 先说结论:目前的 PPT 技能还没法一键到位,但选对工具、用好组合,已经能帮你省下大量时间。


一、PPT 技能分哪几类?

目前 GitHub 上的 PPT 技能,按生成方式主要分为四类:

类型
原理
输出格式
实测技能
网页 PPT
Agent 生成 HTML/Markdown,用 JS 演示框架渲染
.html
frontend-slides、guizang-ppt-skill
原生 PPT
Agent 调用 python-pptx 生成标准幻灯片
.pptx
ppt-master
图像 PPT
Agent 调用 GPT Image 2 / NanoBanana 生图,再嵌入幻灯片
.pptx(图片式)
NanoBanana-PPT-Skills
MCP PPT
Agent 通过 MCP 协议调用第三方平台
.pptx
mcp-server-okppt

四类的核心区别在于怎么画幻灯片

网页 PPT:用 CSS 画,排版最灵活
原生 PPT:用代码画元素,能编辑但排版受限
图像 PPT:用 AI 画图,视觉效果最好但不可编辑
MCP PPT:让第三方平台画,质量取决于第三方

二、实测对比:同一个提示词,不同技能出什么活?

测试提示词

本次实测使用的是一个完整的单页 PPT 规格提示词,包含布局、内容、设计风格等全部要素:

基本规格
比例:16:9(1920×1080)
背景:纯白底
布局:分为上、下左、下右三个模块

布局结构
【顶部模块】- 观点提炼区(约占页面高度 25%)
主题句:「AI Agent:从"只会说"到"动手做"的数字员工革命」
设计:居中放置,字号醒目,下方用一条细分隔线与内容区区分

【上方内容区】- 传统大模型 vs AI Agent(约占页面高度 20%)
主题句:「传统大模型是"问答机器",AI Agent 是"任务执行者"」
内容对比呈现(表格形式)

【下方左半区】- OpenClaw 介绍(约占页面高度 55%,左半宽度)
主题句:「OpenClaw:生态最丰富的开源 Agent 网关」
数据展示:GitHub Stars 367k+、Forks 75k+、Contributors 2k+

【下方右半区】- Hermes Agent 介绍(约占页面高度 55%,右半宽度)
主题句:「Hermes:会自我进化的自主 AI 分身」
数据展示:GitHub Stars 105k+、Token消耗全球第一

设计风格:简洁、专业、科技感,白底+深蓝主色

用这样一个「保姆级」提示词,测试各技能的实际输出效果。


2.1 网页 PPT:frontend-slides

GitHub 地址https://github.com/zarazhangrui/frontend-slides

生成过程:

Agent 收到提示词后,生成 Markdown 格式的幻灯片内容,然后套用 reveal.js 模板渲染为 HTML 文件。

实测效果:

速度:⚡ 最快,5-10 秒出结果
排版:reveal.js 自带主题,无法精确控制布局比例(25%/20%/55%)
内容:Agent 自动生成,但「上方内容区」的表格对比呈现效果一般
交互:支持键盘翻页、全屏模式

2.2 网页 PPT:guizang-ppt-skill

GitHub 地址https://github.com/op7418/guizang-ppt-skill

生成过程:

同样基于 HTML 演示,提供了更丰富的主题模板和 CSS 控制能力。

实测效果:

速度:⚡ 快,10-15 秒
排版:支持模块化布局,但是不会自动调节比例
内容:卡片式边框和背景色块区分层次,更接近设计规格
交互:动画效果丰富

2.3 原生 PPT:ppt-master

GitHub 地址https://github.com/hugohe3/ppt-master

生成过程:

Agent 根据提示词生成 Python 脚本,调用 python-pptx 库创建 .pptx 文件,可以设置布局位置、字体大小、颜色。

实测效果:

速度:⏳ 中等,15-30 秒
排版:能控制三个模块的位置和比例,但样式偏「素」
内容:文字 + 表格,缺少装饰性元素
编辑:✅ 可在 PowerPoint 中完全编辑

符合设计规格的程度:
– ✅ 16:9 比例、1920×1080 尺寸
– ✅ 白底背景
– ⚠️ 三模块布局可以实现,但需要手动计算像素位置
– ❌ 卡片式边框、背景色块需要额外代码
– ❌ 数据部分的图标前缀(⭐ GitHub Stars)需要手动添加


2.4 图像 PPT:GPT-Image-2/NanoBanana-PPT-Skills

GitHub 地址https://github.com/op7418/NanoBanana-PPT-Skills

生成过程:

Agent 先用 GPT Image 2 或 NanoBanana 生成整页幻灯片图片,然后将图片嵌入 .pptx 文件。

实测效果:

速度:🐢 最慢,生成一页约 20-40 秒
排版:🎨 提示词限定,虽达不到Image2的水平,但视觉效果这里面最好
内容:能精确呈现设计规格中的所有要素(布局比例、配色、数据展示风格)
编辑:❌ 不能编辑,每页是一张图片

符合设计规格的程度:
– ✅ 精确的 16:9 比例和像素尺寸
– ✅ 白底 + 深蓝主色的配色风格
– ✅ 三模块布局和比例控制
– ✅ 数据部分数字放大突出、图标前缀
– ✅ 卡片式边框和层次区分


2.5 MCP PPT:mcp-server-okppt

GitHub 地址https://github.com/NeekChaw/mcp-server-okppt

生成过程:

Agent 通过 MCP 协议调用 okppt 设计服务, 生成 SVG,再把 SVG 高质量地嵌进 PPTX 并保留矢量特性

实测效果:

速度:⏳ 30-60 秒
排版:设计感强,自动匹配主题模板
内容:自动配图、配色
编辑✅ 可在 PowerPoint 中完全编辑

符合设计规格的程度:
– ✅ 16:9 比例
– ⚠️ 设计风格由平台模板决定,无法精确控制配色(白底+深蓝)
– ⚠️ 布局比例由平台算法决定,无法精确指定 25%/20%/55%
– ⚠️ 数据展示的图标前缀需要平台支持


实测对比一览

技能
类型
速度
排版质量
符合设计规格
可编辑
frontend-slides
网页
⚡⚡⚡
★★★
⚠️ 部分
guizang-ppt-skill
网页
⚡⚡⚡
★★★☆
⚠️ 部分
ppt-master
原生
⚡⚡
★★
⚠️ 部分
NanoBanana-PPT-Skills
图像
★★★★
✅ 完全
mcp-server-okppt
MCP
★★
⚠️ 部分

三、不同场景怎么选?

演讲、分享 → 网页 PPT

frontend-slides 或 guizang-ppt-skill,简单轻便。你的笔记本电脑打开浏览器就能讲,不需要安装 PowerPoint。代码高亮、数学公式、实时演示都能支持。

技术分享、团队内部分享、meetup 演讲——网页 PPT 足够了。

给老板汇报 → 原生 PPT

用 ppt-master。为什么?因为老板大概率会说「这页数据改一下」「这个标题换个说法」「加一页竞品对比」。如果是图片式的 PPT,你改不了;如果是 HTML,老板电脑上打不开。必须是可编辑的 .pptx。

虽然 ppt-master 生成的不算好看,但它给你一个可编辑的底稿,换个模板、调个颜色,十分钟搞定。

培训课件 → 图像 PPT

用 NanoBanana-PPT-Skills。培训课件最重要的是让人愿意看下去——视觉精美、配色舒服、有图片有图表。内容基本固定,不需要频繁修改,图片式 PPT 的「不可编辑」在这里反而不是问题。


四、总结:现阶段怎么用 PPT 技能最划算?

坦率说,目前的 PPT 技能还没法一键到位。离「给一句话就出一份能直接用的 PPT」还有一段距离。但合理使用,已经能帮你省下大量时间:

对质量有要求:

用 ppt-master 先生成初稿,再打开 PowerPoint 手动编辑。排版虽然素,但结构和内容已经搭好了,你只需要美化——至少省掉 60% 的工作量。

对速度有要求:

用 frontend-slides 或 NanoBanana-2 / GPT Image 2 等技能快速出图。前者适合技术分享,后者适合视觉展示,10 秒到 2 分钟内出结果。

折中方案:

先用网页 PPT 快速确认内容结构,再用 ppt-master 生成可编辑版本,最后在 PowerPoint 里美化。流程多一步,但兼顾速度和质量。

PPT 技能还在快速进化中,相信不久的将来,一键出高质量 PPT 不再是梦想。但在此之前,选对工具、用好组合,才是最务实的做法。


关注「小龙虾踩坑指南」,第一时间收到更多 Agent 工具实测 👇