乐于分享
好东西不私藏

推荐 | AI 做 PPT 的 7 个开源 Skill

推荐 | AI 做 PPT 的 7 个开源 Skill

做 PPT 这件事,正在被 AI Agent 重新定义。

不是那种”输入标题,输出一堆丑哭的模板”的传统 AI PPT 工具。而是一种全新的工作方式:你在 Claude Code、Codex 这些 AI 工具里,用自然语言告诉 AI 你要什么,它就在你的电脑上生成一份完整的演示文稿。

通过 Agent Skill——一套结构化的工作流程指令,直接让 AI 一步一步把你的想法变成一份能用的 PPT。

我收集了目前市面上做 PPT / Slides 最值得关注的 7 个开源 Skill,按照输出格式分成了三大类,逐一拆解它们各自的思路、特色和适用场景,希望对你有用


三种路线

在往下看之前,你需要理解当前 AI 做 PPT 的技术路线。这决定了你应该选哪个 Skill。

路线一:生成 HTML 网页演示。 产物是一个单独的 HTML 文件,浏览器打开就能演示。优势是视觉表现力极强——CSS 动画、WebGL 背景、画布特效,迁移能力极强,浏览器打开可用,什么都能做。劣势是不可编辑、不可协作,客户要你改个字你得重新生成。

路线二:生成原生 PPTX 文件。 产物是一个真正的 PowerPoint 文件,每个文字框、形状、图表都可以点击编辑。优势是交付即可用,客户拿到就能改。劣势是视觉上限受 PowerPoint 本身能力约束。

路线三:生成图片版 PPT。 用 AI 图像模型逐页生成高完成度的视觉图片,再用 PPTX 作为装图片的容器。视觉效果最好,但不可编辑——每一页本质上是一张图,虽然有WPS等其他修改方式,但效果一直不太好。

当然,没有”最好”的路线,只有最适合你场景的路线,继续往下看。


第一类:HTML 网页演示派

这一类 Skill 的共同特点是:输出单文件 HTML,零依赖、零构建,浏览器直接打开。视觉表现力是它们的核心竞争力。

1. Frontend Slides — 视觉发现流的先驱

作者:@zarazhangruiGitHub:zarazhangrui/frontend-slidesStar: 16.5k | 架构: 渐进式加载(~180 行主文件 + 按需加载子模块)

这是目前这个赛道里 Star 数最高的项目,也是最早把”Vibe Coding”理念引入演示文稿制作的 Skill 之一。

它最核心的设计理念是“show, don’t tell”——不问你要什么风格,而是直接生成 3 个视觉预览让你挑。这解决了一个真实痛点:大多数人根本描述不清楚自己想要什么视觉风格,但看到之后一眼就知道喜欢哪个。

内置 12 套精心策划的视觉预设,分为暗色系(Bold Signal、Electric Studio、Creative Voltage、Dark Botanical)、亮色系(Notebook Tabs、Pastel Geometry、Split Pastel、Vintage Editorial)和特殊风格(Neon Cyber、Terminal Green、Swiss Modern、Paper & Ink)。每一套都经过专门调校,刻意回避那种一眼 AI 味的紫色渐变审美。

现在有了另一个亮点是 PPT 转换能力——可以把现有的 PowerPoint 文件转成 Web 演示,保留所有图片和内容。

适合场景: 线下技术分享、Demo Day、个人风格强烈的演讲。你不需要懂 CSS 或 JS,但你需要对”好看”有直觉。

效果展示:

2. 歸藏 Magazine Web PPT — 电子杂志美学的极致克制

作者:@op7418(歸藏)GitHub:op7418/guizang-ppt-skillStar: 5.2k | 架构: 种子模板 + 组件手册 + 质量检查清单

这个 Skill 的视觉基调可以用一句话概括:像 Monocle 杂志贴上了代码的样子。

作者歸藏是在线下分享中反复迭代沉淀出来的这套方案,踩过的每个坑都写进了 checklist。整体设计语言是”电子杂志 × 电子墨水”——衬线大标题 + 非衬线正文 + 等宽元数据的三级字体分工,WebGL 流体背景只在 Hero 页透出,正文页保持极度克制。

提供 5 套主题色预设(墨水经典、靛蓝瓷、森林墨、牛皮纸、沙丘),10 种页面布局骨架,支持横向左右翻页(键盘/滚轮/触屏/底部圆点导航全支持)。

一个值得注意的设计哲学:不允许自定义 hex 色值。作者的态度很明确——”保护美学比给自由更重要”。你只能从预设里选,不能自己配色。这在 Skill 设计里是少见的强主张。

适合场景: 行业私享会、带强烈个人风格的演讲、AI 产品发布。不适合大段表格数据和需要多人协作编辑的场景。

需要注意的是这些场景就不太适合:大段表格数据 / 培训课件(信息密度不够)/ 需要多人协作编辑(静态 HTML)。

效果展示:

3. HTML PPT Studio — 军火库级别的资源量

作者:@lewisluluGitHub:lewislulu/html-ppt-skillStar: 2.8k | 架构: Token 驱动的设计系统 + iframe 隔离预览

如果 Frontend Slides 是精品店,那 HTML PPT Studio 就是军火库。

数字说明一切:36 套主题、14 个完整 Deck 模板、31 种单页布局、27 个 CSS 动画 + 20 个 Canvas 特效。从 minimal-white 到 cyberpunk-neon,从 japanese-minimal 到 news-broadcast,从 pitch-deck-vc 到 xiaohongshu-white——你能想到的风格它几乎都有。

技术实现上有两个亮点。第一,所有颜色、字体、圆角、阴影都走 CSS 变量,换一行 <link> 标签就能换主题皮肤,整套 Deck 自动重排。第二,所有展示页(主题画廊、布局画廊、动画画廊)都用 <iframe> 隔离,每个预览都是真正独立渲染的真实文件。

Canvas 特效部分尤其值得一提——粒子爆发、星空、矩阵雨、力导向知识图谱、神经网络信号脉冲、银河旋涡……每一个都是手写的 Canvas 模块,在幻灯片进入时自动初始化。

适合场景: 需要大量风格选择的场景、技术分享、产品发布、课件制作。资源量最大,但也意味着选择成本最高——你需要从 36 个主题里挑一个。

效果展示:


第二类:原生 PPTX 派

4. PPT Master — “不能在 PowerPoint 里编辑的就不该叫 PPT”

作者:@hugohe3(何雨果 / Hugo He)GitHub:hugohe3/ppt-masterStar: 12.1k | 架构: SVG → DrawingML 转换管线

这是目前原生 PPTX 方向做得最完整的项目,也是理念最鲜明的一个。

作者何雨果是投融资领域从业者(注册会计师、资产评估师),工作中每天审阅和修改 PPT。他对现有 AI PPT 工具最大的不满就是:它们输出的要么是图片,要么是截图——好看但不可编辑。所以他做了 PPT Master,核心承诺只有一个:每个元素都是真正的 PowerPoint 对象,点击即可编辑。

技术路线是:AI 先生成 SVG,再通过自研的转换管线把 SVG 转成原生 DrawingML(PowerPoint 的底层 XML 格式)。这意味着输出的文字框、形状、图表都是真正的 PowerPoint 原生对象,不是嵌入的图片。

功能覆盖面也是最广的:支持 PDF/DOCX/URL/Markdown 多种输入源,20 种布局模板,52 个可视化模板(图表、信息图、流程图、关系图、战略框架),6700+ 个矢量图标,原生页面转场和元素入场动画(真正的 OOXML,不是嵌入视频)。

更进一步,它还支持语音旁白和视频导出——从演讲者备注自动生成语音(支持 edge-tts 和多家云端 TTS),嵌入回 PPTX,用 PowerPoint 直接导出带旁白的 MP4。甚至支持 ElevenLabs/MiniMax 等服务的声音克隆,用你自己的声音念稿。

兼容性方面,几乎所有 AI IDE 都支持——Claude Code、Cursor、VS Code + Copilot、Codebuddy、Gemini CLI 等。模型推荐 Claude Opus/Sonnet,但 GPT、Gemini 等也能用。

适合场景: 需要交付可编辑 PPT 的所有商业场景——投资路演、咨询报告、企业内部汇报。这是一个”交付即可用”的方案。

效果展示:

5. MiniMax pptx-generator — 官方技能包的工程化实践

出品方:MiniMax-AIGitHub:MiniMax-AI/skills/pptx-generator整体仓库 Star: 11.6k | 架构: PptxGenJS + XML 编辑双管线

这是 MiniMax 官方技能库的一部分,走的也是原生 PPTX 路线,但技术实现和 PPT Master 不同。

它提供两条管线:从零创建用 PptxGenJS(JavaScript 库),编辑已有 PPTX 用 XML 解包-编辑-重新打包的工作流。还支持用 markitdown 从已有 PPT 中提取文本。

设计系统包含完整的色板参考和字体参考,每种幻灯片类型(封面、目录、内容、分节页、总结页)都有详细的布局指导和 ASCII 示意图。支持子代理并行生成多张幻灯片。

作为 MiniMax 官方技能库的一部分,它可以和同仓库的 vision-analysis(图像分析)、minimax-xlsx(Excel 处理)等技能联动,适合需要搭建完整内容生产管线的团队。

适合场景: 已经在使用 MiniMax 生态(Claude code / Codex / OpenCode等)的开发者,需要和其他 MiniMax 技能联动的场景。

效果展示:


第三类:AI 图像生成派

6. baoyu-slide-deck — 图片版 Slides 的成熟工作流

作者:@JimLiu(宝玉)GitHub:JimLiu/baoyu-skills/baoyu-slide-deck整体仓库 Star: 17.2k,但 baoyu-skills 是 Claude Code 社区最活跃的技能库之一

宝玉的 slide-deck 走的是第三条路线:用 AI 图像模型逐页生成高完成度的视觉图片,再打包成 PPTX/PDF。

这不是”做不出真 PPT 所以退而求其次”——而是有意为之的设计选择。它生成的 Deck 定位是“为阅读和分享设计,而非现场演示”:每一页都自带完整上下文,不需要演讲者口头补充。这特别适合在微信、邮件、Slack 里直接分享的场景。

风格系统采用四维架构:质感(Texture)× 情绪(Mood)× 字体(Typography)× 密度(Density),16 个预设映射到具体的维度组合,也支持完全自定义。内置 blueprint、corporate、sketch-notes、minimal 等 10+ 种预设风格。

工作流也很成熟:分析内容 → 确认风格/受众/页数 → 生成大纲 → 生成逐页 Prompt → 生成图片 → 打包输出。每一步都可以中断确认或跳过,支持单页重新生成。作为 baoyu-skills 套件的一部分,它还可以和小红书图文生成、封面图生成、文章配图等技能联动。

适合场景: 微信/社交媒体分享型 Deck、视觉要求极高的内容卡片、不需要编辑的一次性视觉产物。

效果展示:

7. visual-style-ppt — 风格驱动的图像演示

作者:@irenerachelGitHub:irenerachel/visual-style-ppt-skillStar: 48 | 架构: 风格库 + Image 2 生图 + PPTX 容器

和 baoyu-slide-deck 类似,visual-style-ppt 也走图片生成路线,但它的核心差异在于把视觉风格当作可复用资产来管理。

你可以从截图、参考图、已有 Deck 中提炼出一套视觉风格,保存成 Markdown 文件,之后反复复用。目前内置三套风格:终端科技杂志风(适合 AI/开发者工具)、冲击力网格编辑风(适合观点型内容)、法式编辑商业风(适合品牌/消费/生活方式)。

每套风格都包含一个 “Style Lock” 章节——锁定字体气质、布局网格、色彩比例、边框系统、页眉页脚、文本密度和 Image 2 的负向约束。这确保了一套 Deck 内部视觉高度统一。

一个硬规则:所有图片必须由 Image 2 模型生成,严禁 HTML 出图或任何本地渲染替代方案。 如果 Image 2 不可用,Skill 会直接停止工作。这是对输出质量的强保障, Image 2 的生图能力也足够强大,但也意味着必须有 Image 2 的访问权限。

适合场景: 需要维护统一视觉品牌的团队、小红书信息图、文章配图、视觉化报告——任何需要”一套风格反复用”的场景。

效果展示:


怎么选呢

Skill
输出格式
可编辑性
视觉上限
适合场景
上手门槛
Frontend Slides
HTML
需改代码
★★★★★
技术分享、Demo Day
歸藏 Magazine PPT
HTML
需改代码
★★★★★
私享会、品牌发布
HTML PPT Studio
HTML
需改代码
★★★★★
大量风格需求、课件
PPT Master
PPTX
完全可编辑
★★★★
商业交付、咨询报告
MiniMax pptx-gen
PPTX
完全可编辑
★★★
MiniMax 生态用户
baoyu-slide-deck
图片→PPTX
不可编辑
★★★★★
社交分享、视觉卡片
visual-style-ppt
图片→PPTX
不可编辑
★★★★★
品牌视觉、风格复用

三个快速决策路径:

  1. 客户/老板要能改?
     → PPT Master。
  2. 自己演讲用,要酷炫?
     → Frontend Slides 、歸藏 Magazine PPT或者visual-style-ppt
  3. 做完直接发朋友圈/微信群?
     → baoyu-slide-deck。

写在最后

这 7 个项目代表了当前 AI 做演示文稿的三种思路,也折射出一个更大的趋势:专业工具正在从”产品”变成”技能”。

现在,一个 Skill 文件就是一套完整的专业能力——它活在你自己的电脑上,用你自己选择的 AI 模型,数据不出本地,成本完全可控。

这 7 个 Skill 全部开源、免费。去试试吧。

唯一的成本是你使用 AI 模型的费用了。

如果不想折腾,想免费、快速的完成一个做PPT的工作,那么,豆包或许是更方便快捷的选择,可以看我之前写的分享文章:

可编辑!豆包生成PPT实操手册