AI 短剧制作 Skill

我做了一个 AI 短剧制作 Skill：从想法到分镜、提示词、审核和交付

最近我一直在学习 AI 短剧制作，也发现一个很真实的问题：很多新手不是没有想法，而是不知道下一步该做什么。

比如：

我有一个故事，但不知道怎么压缩成 1 分钟短片。
我想做产品宣传，但不知道先写文案还是先生成图。
我想做手机科普，但不知道怎么把知识点变成画面。
我已经生成了几张参考图，但不知道哪张能继续做图生视频。
我已经有视频片段了，但不知道能不能剪成一支完整作品。
我准备投稿或交付，但不知道成片有没有明显问题。

所以我做了一个 Codex Skill：

ai-short-drama-workflow

它不是一个单纯帮你“写提示词”的 Skill，而是一个更完整的 AI 视频制作陪跑工作流。

GitHub 地址：https://github.com/tianqing-Y/ai-short-drama-workflow

这个 Skill 是做什么的？

ai-short-drama-workflow 的目标，是把一个模糊的创意、真实需求或交付目标，整理成可以执行、可以生成、可以剪辑、可以交付的 AI 视频制作方案。

它支持的方向不只限于剧情短片，也包括：

AI 短剧
剧情短片
情绪短片
参赛短片
产品宣传
品牌概念片
手机/数码科普
知识科普短片
空间展示
活动展示
客户样片
作品集样片
图生视频项目

我希望它解决的不是“给我一段漂亮文案”这种单点问题，而是解决新手最容易卡住的制作链路：

想法/需求-> 信息收集-> 主题或信息目标提炼-> 结构选择-> 视觉设定-> 参考图-> 分镜表-> 图片提示词-> 视频提示词-> 制作排期-> 迭代修复-> 成片质检

为什么我要做这个 Skill？

一开始我想做 AI 短剧时，最大的感受是：工具很多，但流程很散。

图片生成工具可以出图，视频工具可以图生视频，剪辑软件可以做字幕和音乐。但真正困难的是：

什么时候该定主题？
什么时候该做视觉设定？
什么时候该生成参考图？
哪些图能继续做视频？
视频片段不好时，是提示词问题、参考图问题，还是分镜问题？
粗剪不好看，是镜头问题、节奏问题，还是故事本身不成立？

如果没有一个总控流程，新手很容易变成这样：

想到一个故事-> 直接写提示词-> 生成一堆图-> 图不统一-> 改提示词-> 视频又漂-> 越修越乱-> 最后不知道该重做还是继续剪

所以这个 Skill 的核心不是“炫技”，而是帮助用户少走弯路。

它会优先判断你现在处在哪个阶段，然后只处理当前阶段的问题，而不是每次都跑完整流程。

它和普通提示词模板有什么不同？

普通提示词模板通常是：

你给我一个主题，我给你图片提示词或视频提示词。

但这个 Skill 更像一个制作助理：

你告诉我你现在有什么、想做什么、卡在哪里，它先判断你当前阶段，再告诉你下一步具体该产出什么。

比如用户说：

使用 ai-short-drama-workflow，我想做一个 60 秒手机科普短片，但不知道下一步。

它不会一上来把主题、分镜、提示词、排期、质检全部塞给你，而是会先输出：

你现在处在：最该先解决的是：建议先不要做：下一步交付物：你需要发给我的内容：

这对新手很重要。因为很多时候，新手不是缺内容，而是一次拿到太多内容之后更迷茫。

它是分阶段工作的

我专门在 SKILL.md 里写了分阶段协作规则：

用户不知道下一步时，先做阶段诊断。
用户只需要当前阶段时，不跑全流程。
用户发来参考图时，先判断图能不能进入图生视频。
用户发来视频片段时，先判断片段可用、待修还是废弃。
用户发来粗剪时，再进入剪辑审核或成片质检。

也就是说，它更像一个陪跑流程：

我出方案你去生成你把结果发回来我帮你判断再进入下一步

而不是：

我一次性给你一堆内容然后你自己硬做到底

文件结构

这个 Skill 的文件结构是这样：

ai-short-drama-workflow/├── SKILL.md├── agents/│   └── openai.yaml└── references/    ├── intake.md    ├── workflow.md    ├── story-structures.md    ├── visual-bible.md    ├── prompt-patterns.md    ├── shot-sheet-template.md    ├── production-plan.md    ├── iteration-guide.md    ├── quality-checklist.md    └── common-mistakes.md

每个文件负责一个阶段，不会把所有内容都堆在 SKILL.md 里。

核心文件说明

`SKILL.md`

这是入口文件，负责告诉 Codex：

这个 Skill 什么时候该触发
第一次回应应该怎么判断阶段
哪些 reference 文件在什么时候读取
不要一次性读取所有文件
不要默认跑完整流程
用户发来图片、视频、粗剪时应该怎么处理

我把它设计成一个“调度中心”。

`references/intake.md`

负责信息收集和阶段判断。

它解决的问题是：

用户只有一个模糊想法怎么办？
用户不知道下一步怎么办？
用户是小白，最多该问几个问题？
用户有截止日期时，先问什么？
用户已经有参考图或视频片段时，应该进入哪个阶段？

我特别加了一个模板：

你现在处在：最该先解决的是：建议先不要做：下一步交付物：你需要发给我的内容：

这个模板是给“我不知道下一步”的场景用的。

`references/workflow.md`

负责完整制作流程。

当用户明确说“给我完整方案”时，才会进入这个文件。它会从项目判断、主题/信息目标、结构、视觉设定、参考图计划、分镜、生成计划、剪辑计划一路走到风险提醒。

但如果用户只是想解决当前阶段的问题，就不应该默认调用全流程。

`references/story-structures.md`

负责结构设计。

它不只支持传统剧情，也支持：

单事件结构
目标任务结构
反转结构
对照结构
递进结构
回环结构
世界观展示结构
旁白意象结构
产品/品牌结构
知识科普结构

我后来特意做了泛化，避免它只适合情感故事。

`references/visual-bible.md`

负责视觉设定，也就是让画面像来自同一个作品。

它会帮助建立：

主角/主体/核心对象卡
配角或辅助对象卡
主场景卡
色彩策略
镜头语言
统一风格词
反向词
参考图生成顺序

这里我也补了非人物项目，比如产品、空间、活动、知识科普。

因为 AI 视频最常见的问题不是单张图不好看，而是每个镜头像来自不同世界。

`references/prompt-patterns.md`

负责图片和视频提示词模板。

它区分了：

角色或主体参考图提示词
场景参考图提示词
关键帧图片提示词
图生视频提示词
文生视频提示词
反向词
提示词修复规则

这里有一个很重要的原则：

图片提示词负责“画面是什么”。视频提示词负责“画面怎么动”。

很多新手会把静态画面描述和动态视频描述混在一起，导致提示词越来越长，结果越来越乱。

`references/shot-sheet-template.md`

负责分镜表。

它会把故事或需求拆成可执行镜头，而不是只写漂亮画面。

每个镜头都要有：

镜头编号
时间码
时长
段落作用
画面内容
主体/角色
场景
景别
机位
镜头运动
情绪/信息/任务作用
图片提示词
视频提示词
风险点

这个文件的重点是：每个镜头必须有任务。

没有任务的漂亮镜头，最后很容易变成素材拼贴。

`references/production-plan.md`

负责制作排期。

如果用户有截止日期，它会优先倒排：

几天内适合做多长
镜头数控制多少
哪天锁故事
哪天锁参考图
哪天生成视频
哪天粗剪
哪天质检导出

比如 5-7 天、8-14 天、15-21 天，它都有不同计划。

`references/iteration-guide.md`

负责修复生成失败。

这是我很看重的一个文件，因为 AI 制作不可能一次就完美。

它会判断：

人物或主体漂移
场景不统一
风格跑偏
动作不连贯
表演过度
提示词越改越乱
画面太空
画面太乱
AI 味太重
粗剪节奏不顺

我还专门补了：

参考图审核
视频片段审核

因为真实工作流里，用户经常会生成几张图或几个视频片段回来问：“这个能用吗？”

这个 Skill 会先判断素材是：

可用待修废弃

然后再决定下一步。

`references/quality-checklist.md`

负责成片质检。

它会检查：

目标和要求
故事和信息
视觉一致性
生成瑕疵
剪辑节奏
字幕和文字
声音和音乐
导出格式
授权和署名
最终判断

最终会判断：

可以提交需要小修需要结构性调整

如果用户只发了关键截图、镜头列表或字幕稿，它也可以做部分质检，但会说明哪些地方暂时无法判断。

`references/common-mistakes.md`

负责新手常见问题纠偏。

比如：

想法太大
主题太多
需求目标不清
只有情绪，没有事件
镜头太多
每个镜头都难生成
风格跳变
字幕太多
最后一天还在大改

这里我也补了一个很重要的问题：

非人物主体被当成人物剧情处理

比如做产品、空间、活动、知识科普时，不应该强行套“主角成长故事”。它们更适合用：

问题 -> 解决
使用前 -> 使用后
信息递进
动线展示
视觉记忆点
任务完成

使用方式

安装后可以这样调用：

使用 ai-short-drama-workflow，我想做一个 60 秒手机科普短片，但不知道下一步。

或者：

使用 ai-short-drama-workflow，只做当前阶段，帮我判断下一步。

如果你已经有参考图，可以这样说：

使用 ai-short-drama-workflow，这是我生成的参考图，帮我判断哪些能继续做图生视频。

如果你已经有视频片段，可以这样说：

使用 ai-short-drama-workflow，这是我生成的视频片段，帮我判断可用、待修还是废弃。

如果你已经有粗剪，可以这样说：

使用 ai-short-drama-workflow，这是我的粗剪，帮我按投稿标准质检。

一个典型使用流程

假设我要做一个手机科普短片。

我可以先说：

使用 ai-short-drama-workflow，我想做一个 60 秒手机科普短片，但不知道下一步。

它应该先帮我判断：

你现在处在：模糊需求阶段最该先解决的是：确定一个具体知识点和观众误区建议先不要做：不要直接生成图片或视频下一步交付物：一个可拍的科普结构你需要发给我的内容：想讲的手机功能、目标观众、发布平台

然后我补充信息。它再帮我做结构。结构定了以后，再做视觉设定。视觉设定之后，再生成参考图提示词。我拿提示词去图片工具生成图，再回来让它审核。审核通过后，再进入图生视频。视频片段出来后，再回来筛选。最后粗剪完成，再做质检。

这就是我想要的分阶段陪跑方式。

效果展示建议

1. 阶段判断

2. 参考图审核

3. 视频片段审核

输入：

这是我生成的视频片段，帮我判断能不能放进时间线。

展示它如何判断镜头任务、动作、风格和修复方向。

4. 粗剪质检

建议将skill中相关的这一部分单独拿出来配合上专业的工具去搞

输入：

这是我的粗剪，帮我按投稿标准质检。

展示它如何输出可以提交、需要小修还是需要结构调整。

我对这个 Skill 的定位

我不想把它做成一个“万能爆款短剧生成器”。

我更希望它像一个制作陪跑助手：

不替你假装有灵感。
不一上来塞一堆复杂导演术语。
不把所有项目都套成同一种情感故事。
不把产品、空间、科普强行写成主角剧情。
不鼓励新手一开始就做超复杂镜头。

它更关注：

能不能完成
能不能生成
能不能剪起来
能不能交付
能不能复盘

对新手来说，第一支作品最重要的不是惊艳，而是完整。

GitHub 链接

Skill 地址：

https://github.com/tianqing-Y/ai-short-drama-workflow

持续更新中...

请在微信客户端打开