AI 生成 PPT 新范式:Image-first 的分阶段推进工作流
👉 GitHub 开源地址:NyxTides/ppt-image-first
背景
你有没有过这种体验:让 AI 帮你做一个 PPT,它噼里啪啦给你生成一大串页面,内容工整、格式标准,但就是感觉"不对"——文字和主题贴不上、风格和场景不搭、叙事深度不够。
这类问题通常源于两个原因:太模板化(套模板填内容)或太浅(视觉像 PPT 但内容撑不起汇报)。
`ppt-image-first` 是一个专门为 AI 编码 agents(Codex / Claude Code / Opencode CLI)设计的 PPT skill,它的思路不太一样——不靠模板,先用 AI 画图,再把图装进 PPTX。
核心特点:Image-first
传统 PPT 生成是"文字优先":先有文字内容框架,再配图、配色、规划版式。
`ppt-image-first` 反过来:先用 GPT Image 2 生成整页视觉图,确认风格和内容匹配之后,再把这些图放进 PPTX 容器。

图1:工作流总览
这意味着:
每一页的视觉是"完整"的,不是后期拼贴
风格一致性靠图像生成来保证,而非靠模板
最终成品接近高完成度的视觉稿,适合展示、汇报、甚至再做图像级 retouch
工作流:分阶段推进,每步可确认
这套 workflow 分成 5 个阶段,每个阶段都有明确的确认点:

图2:答辩类首页示例
Stage 1 — Intake and Baseline Judgment
只问最必要的几个问题:用途、受众、大致页数、手头材料。没有长表单式填写,用户像甲方一样做判断题和选择题。
Stage 1.25 — 内容研究与基底生成
如果用户只有主题或散材料,skill 会先生成一份 `content_report.md`,把薄内容补成可支撑 PPT 叙事的内容主线。这让后面的预览不再是空壳。
Stage 2 — 风格提案与预览
产出多套风格方向,覆盖首页、目录页、正文页,每套都带真实图像预览。用户看图决定方向,而不是在文字描述里选。
Stage 2.5 — 风格 Refinement
对某套方向基本满意但还想调?可以继续在这个方向上迭代,而不是强迫立即定稿。
Stage 3 — 规划文件生成
依次生成 `design_spec.md`(全局方向约束)、`slide_blueprint.md`(逐页内容策略)、`spec_lock.md`(执行约束),然后进入生成前确认。
Stage 4 — 生成
用户选择每页出 1 张最终图,还是先出多张候选再选。
Stage 5 — Review and Retouch
第一版结果出来后进入 review loop,不满意就继续返修,不是"生成即结束"。
内置工作流 UI 壳子
这个 skill 自带 3 个固定工作流界面壳子:
ppt-image-first/├─ assets/│ ├─ preview_shell/ # 风格预览比较│ ├─ candidate_picker_shell/ # 多候选选图│ └─ review_shell/ # 评审与返修它们不是可选附件,是工作流的一部分,建议直接使用。
典型使用场景
这套 workflow 特别适合:
"帮我做一个 PPT"
"把这份报告整理成演示稿"
"帮我做答辩 PPT"
"做一个产品介绍 deck"
"先给我几套视觉方向看看,再决定风格"
它不承诺每个页面元素都是 PowerPoint 原生可编辑对象——成品是视觉稿式演示页,适合展示和继续 retouch,但文字和图形不能像原生 PPT 那样逐项编辑。
项目状态
项目目前处于早期活跃阶段,commit 记录显示几乎每天都有更新,维护频率很高。Issue 目前 0 个 open,说明基础功能已经相对完善。
快速上手
# Clone 项目git clone https://github.com/NyxTides/ppt-image-first.gitcd ppt-image-first# 查看工作流总览# 打开 docs/images/workflow-overview-slide.png 查看整体流程# 下载示例 PPT 直接体验成品# docs/demo/ppt-image-first-demo-deck.pptx和传统 PPT skill 的核心区别
局限性
需要注意的是,这个 skill 输出的不是"完全可编辑 PPT":
页面内的文字、图形、装饰元素不能像原生 PowerPoint 对象那样逐项编辑
更接近高完成度视觉稿,适合展示用途
如果需要原生可编辑元素的 PPT,这个工具不适用
总结
`ppt-image-first` 用一种新的思路解决 PPT 生成的质量问题:不靠模板,靠 AI 画图。通过多阶段确认流程——从轻量 intake 到内容基底生成,到风格预览,再到规划文件和最终生成——让最终成品真正和主题贴合、和场景匹配。
如果你厌倦了 AI 生成的那种"工整但空洞"的 PPT,这套 workflow 值得一试。
夜雨聆风