我做了一个 AI 短剧制作 Skill:从想法到分镜、提示词、审核和交付
最近我一直在学习 AI 短剧制作,也发现一个很真实的问题:很多新手不是没有想法,而是不知道下一步该做什么。
比如:
我有一个故事,但不知道怎么压缩成 1 分钟短片。 我想做产品宣传,但不知道先写文案还是先生成图。 我想做手机科普,但不知道怎么把知识点变成画面。 我已经生成了几张参考图,但不知道哪张能继续做图生视频。 我已经有视频片段了,但不知道能不能剪成一支完整作品。 我准备投稿或交付,但不知道成片有没有明显问题。
所以我做了一个 Codex Skill:
ai-short-drama-workflow
它不是一个单纯帮你“写提示词”的 Skill,而是一个更完整的 AI 视频制作陪跑工作流。
GitHub 地址:https://github.com/tianqing-Y/ai-short-drama-workflow
这个 Skill 是做什么的?
ai-short-drama-workflow 的目标,是把一个模糊的创意、真实需求或交付目标,整理成可以执行、可以生成、可以剪辑、可以交付的 AI 视频制作方案。
它支持的方向不只限于剧情短片,也包括:
AI 短剧 剧情短片 情绪短片 参赛短片 产品宣传 品牌概念片 手机/数码科普 知识科普短片 空间展示 活动展示 客户样片 作品集样片 图生视频项目
我希望它解决的不是“给我一段漂亮文案”这种单点问题,而是解决新手最容易卡住的制作链路:
想法/需求-> 信息收集-> 主题或信息目标提炼-> 结构选择-> 视觉设定-> 参考图-> 分镜表-> 图片提示词-> 视频提示词-> 制作排期-> 迭代修复-> 成片质检为什么我要做这个 Skill?
一开始我想做 AI 短剧时,最大的感受是:工具很多,但流程很散。
图片生成工具可以出图,视频工具可以图生视频,剪辑软件可以做字幕和音乐。但真正困难的是:
什么时候该定主题? 什么时候该做视觉设定? 什么时候该生成参考图? 哪些图能继续做视频? 视频片段不好时,是提示词问题、参考图问题,还是分镜问题? 粗剪不好看,是镜头问题、节奏问题,还是故事本身不成立?
如果没有一个总控流程,新手很容易变成这样:
想到一个故事-> 直接写提示词-> 生成一堆图-> 图不统一-> 改提示词-> 视频又漂-> 越修越乱-> 最后不知道该重做还是继续剪所以这个 Skill 的核心不是“炫技”,而是帮助用户少走弯路。
它会优先判断你现在处在哪个阶段,然后只处理当前阶段的问题,而不是每次都跑完整流程。
它和普通提示词模板有什么不同?
普通提示词模板通常是:
你给我一个主题,我给你图片提示词或视频提示词。但这个 Skill 更像一个制作助理:
你告诉我你现在有什么、想做什么、卡在哪里,它先判断你当前阶段,再告诉你下一步具体该产出什么。比如用户说:
使用 ai-short-drama-workflow,我想做一个 60 秒手机科普短片,但不知道下一步。它不会一上来把主题、分镜、提示词、排期、质检全部塞给你,而是会先输出:
你现在处在:最该先解决的是:建议先不要做:下一步交付物:你需要发给我的内容:这对新手很重要。因为很多时候,新手不是缺内容,而是一次拿到太多内容之后更迷茫。
它是分阶段工作的
我专门在 SKILL.md 里写了分阶段协作规则:
用户不知道下一步时,先做阶段诊断。 用户只需要当前阶段时,不跑全流程。 用户发来参考图时,先判断图能不能进入图生视频。 用户发来视频片段时,先判断片段可用、待修还是废弃。 用户发来粗剪时,再进入剪辑审核或成片质检。
也就是说,它更像一个陪跑流程:
我出方案你去生成你把结果发回来我帮你判断再进入下一步而不是:
我一次性给你一堆内容然后你自己硬做到底文件结构
这个 Skill 的文件结构是这样:
ai-short-drama-workflow/├── SKILL.md├── agents/│ └── openai.yaml└── references/ ├── intake.md ├── workflow.md ├── story-structures.md ├── visual-bible.md ├── prompt-patterns.md ├── shot-sheet-template.md ├── production-plan.md ├── iteration-guide.md ├── quality-checklist.md └── common-mistakes.md每个文件负责一个阶段,不会把所有内容都堆在 SKILL.md 里。
核心文件说明
SKILL.md
这是入口文件,负责告诉 Codex:
这个 Skill 什么时候该触发 第一次回应应该怎么判断阶段 哪些 reference 文件在什么时候读取 不要一次性读取所有文件 不要默认跑完整流程 用户发来图片、视频、粗剪时应该怎么处理
我把它设计成一个“调度中心”。
references/intake.md
负责信息收集和阶段判断。
它解决的问题是:
用户只有一个模糊想法怎么办? 用户不知道下一步怎么办? 用户是小白,最多该问几个问题? 用户有截止日期时,先问什么? 用户已经有参考图或视频片段时,应该进入哪个阶段?
我特别加了一个模板:
你现在处在:最该先解决的是:建议先不要做:下一步交付物:你需要发给我的内容:这个模板是给“我不知道下一步”的场景用的。
references/workflow.md
负责完整制作流程。
当用户明确说“给我完整方案”时,才会进入这个文件。它会从项目判断、主题/信息目标、结构、视觉设定、参考图计划、分镜、生成计划、剪辑计划一路走到风险提醒。
但如果用户只是想解决当前阶段的问题,就不应该默认调用全流程。
references/story-structures.md
负责结构设计。
它不只支持传统剧情,也支持:
单事件结构 目标任务结构 反转结构 对照结构 递进结构 回环结构 世界观展示结构 旁白意象结构 产品/品牌结构 知识科普结构
我后来特意做了泛化,避免它只适合情感故事。
references/visual-bible.md
负责视觉设定,也就是让画面像来自同一个作品。
它会帮助建立:
主角/主体/核心对象卡 配角或辅助对象卡 主场景卡 色彩策略 镜头语言 统一风格词 反向词 参考图生成顺序
这里我也补了非人物项目,比如产品、空间、活动、知识科普。
因为 AI 视频最常见的问题不是单张图不好看,而是每个镜头像来自不同世界。
references/prompt-patterns.md
负责图片和视频提示词模板。
它区分了:
角色或主体参考图提示词 场景参考图提示词 关键帧图片提示词 图生视频提示词 文生视频提示词 反向词 提示词修复规则
这里有一个很重要的原则:
图片提示词负责“画面是什么”。视频提示词负责“画面怎么动”。很多新手会把静态画面描述和动态视频描述混在一起,导致提示词越来越长,结果越来越乱。
references/shot-sheet-template.md
负责分镜表。
它会把故事或需求拆成可执行镜头,而不是只写漂亮画面。
每个镜头都要有:
镜头编号 时间码 时长 段落作用 画面内容 主体/角色 场景 景别 机位 镜头运动 情绪/信息/任务作用 图片提示词 视频提示词 风险点
这个文件的重点是:每个镜头必须有任务。
没有任务的漂亮镜头,最后很容易变成素材拼贴。
references/production-plan.md
负责制作排期。
如果用户有截止日期,它会优先倒排:
几天内适合做多长 镜头数控制多少 哪天锁故事 哪天锁参考图 哪天生成视频 哪天粗剪 哪天质检导出
比如 5-7 天、8-14 天、15-21 天,它都有不同计划。
references/iteration-guide.md
负责修复生成失败。
这是我很看重的一个文件,因为 AI 制作不可能一次就完美。
它会判断:
人物或主体漂移 场景不统一 风格跑偏 动作不连贯 表演过度 提示词越改越乱 画面太空 画面太乱 AI 味太重 粗剪节奏不顺
我还专门补了:
参考图审核 视频片段审核
因为真实工作流里,用户经常会生成几张图或几个视频片段回来问:“这个能用吗?”
这个 Skill 会先判断素材是:
可用待修废弃然后再决定下一步。
references/quality-checklist.md
负责成片质检。
它会检查:
目标和要求 故事和信息 视觉一致性 生成瑕疵 剪辑节奏 字幕和文字 声音和音乐 导出格式 授权和署名 最终判断
最终会判断:
可以提交需要小修需要结构性调整如果用户只发了关键截图、镜头列表或字幕稿,它也可以做部分质检,但会说明哪些地方暂时无法判断。
references/common-mistakes.md
负责新手常见问题纠偏。
比如:
想法太大 主题太多 需求目标不清 只有情绪,没有事件 镜头太多 每个镜头都难生成 风格跳变 字幕太多 最后一天还在大改
这里我也补了一个很重要的问题:
非人物主体被当成人物剧情处理比如做产品、空间、活动、知识科普时,不应该强行套“主角成长故事”。它们更适合用:
问题 -> 解决 使用前 -> 使用后 信息递进 动线展示 视觉记忆点 任务完成
使用方式
安装后可以这样调用:
使用 ai-short-drama-workflow,我想做一个 60 秒手机科普短片,但不知道下一步。或者:
使用 ai-short-drama-workflow,只做当前阶段,帮我判断下一步。如果你已经有参考图,可以这样说:
使用 ai-short-drama-workflow,这是我生成的参考图,帮我判断哪些能继续做图生视频。如果你已经有视频片段,可以这样说:
使用 ai-short-drama-workflow,这是我生成的视频片段,帮我判断可用、待修还是废弃。如果你已经有粗剪,可以这样说:
使用 ai-short-drama-workflow,这是我的粗剪,帮我按投稿标准质检。一个典型使用流程
假设我要做一个手机科普短片。
我可以先说:
使用 ai-short-drama-workflow,我想做一个 60 秒手机科普短片,但不知道下一步。它应该先帮我判断:
你现在处在:模糊需求阶段最该先解决的是:确定一个具体知识点和观众误区建议先不要做:不要直接生成图片或视频下一步交付物:一个可拍的科普结构你需要发给我的内容:想讲的手机功能、目标观众、发布平台然后我补充信息。它再帮我做结构。结构定了以后,再做视觉设定。视觉设定之后,再生成参考图提示词。我拿提示词去图片工具生成图,再回来让它审核。审核通过后,再进入图生视频。视频片段出来后,再回来筛选。最后粗剪完成,再做质检。
这就是我想要的分阶段陪跑方式。
效果展示建议
1. 阶段判断


2. 参考图审核

3. 视频片段审核
输入:
这是我生成的视频片段,帮我判断能不能放进时间线。展示它如何判断镜头任务、动作、风格和修复方向。

4. 粗剪质检
建议将skill中相关的这一部分单独拿出来配合上专业的工具去搞
输入:
这是我的粗剪,帮我按投稿标准质检。展示它如何输出可以提交、需要小修还是需要结构调整。
我对这个 Skill 的定位
我不想把它做成一个“万能爆款短剧生成器”。
我更希望它像一个制作陪跑助手:
不替你假装有灵感。 不一上来塞一堆复杂导演术语。 不把所有项目都套成同一种情感故事。 不把产品、空间、科普强行写成主角剧情。 不鼓励新手一开始就做超复杂镜头。
它更关注:
能不能完成 能不能生成 能不能剪起来 能不能交付 能不能复盘
对新手来说,第一支作品最重要的不是惊艳,而是完整。
GitHub 链接
Skill 地址:
https://github.com/tianqing-Y/ai-short-drama-workflow
持续更新中...
请在微信客户端打开
夜雨聆风