AI实战:从0到成片,我用OpenClaw一键生成分镜→故事板→视频,全程详解

今天折腾了一套用 OpenClaw 生成短视频的完整工作流：从一段文案出发，AI 自动拆解成分镜脚本，再生成可视化的故事板图片，最后还能直接生成视频。

整个过程不需要太多干预，只要你会写文案，就能做出电影感的视频，效果如下。

下面把完整流程整理成教程，小白也能参考搭建出来。另外本教程涉及的Coze工作流搭建部分，可以参考我的其他文章。

一、整体工作流程

文案/剧情梗概    ↓分镜脚本（AI 自动拆解：运镜、景别、动作、光影、音效）    ↓故事板图片（Chatgpt Image2 可视化分镜，9:16 / 21:9 等比例）    ↓视频（Seedance2.0，参考故事板拍摄或直接 AI 生成）

核心工具：OpenClaw + Coze 工作流

核心模型：Seedance2.0 + Chatgpt Image2 + Minimax2.7

二、前置准备

2.1 环境要求

OpenClaw

已部署并正常运行
Coze 账号

：需要获取 API Token（JWT 格式）
Coze 工作流

：提前创建好两个工作流（也可以其他API直接调用）

media-chatgpt-image2

：图片生成工作流（workflow_id: 76343507547840890）
media-seedance2-vedio

：视频生成工作流（workflow_id: 76393348946260438）

2.2 获取 Coze API Token

登录 coze.cn
点击「扣子编程」→ 点击「资源库」→ 右上角的「资源」→ 选择「工作流」→右上角选「API」
创建一个 Access Token（JWT 格式，类似于 eyJhbGciOiJIUzI1NiIsInR5cCI6IkpVCJ9...）
将 Token 记录下来，后续调用 API 时使用

⚠️ Token 属于敏感信息，请勿泄露。

三、安装 OpenClaw Skill

OpenClaw 通过 Skill 扩展能力。我们需要安装两个核心 Skill：

3.1 分镜脚本生成器：script2shot-skill

功能：输入文案和基础参数，自动电影感分镜脚本。

安装方式：将以下内容丢给小龙虾，它会帮创建skill, 文件保存到 ~/.opennclaw/skills/script2shot-skill/SKILL.md

# Skill: 电影感分镜生成器## 输入参数- 主题、视频总时长、分段时长、视频比例- 旁白风格、BGM类型、画面元素- 剧本/剧情梗概## 输出每段默认 10 秒，每段 2~3 个镜头，每个镜头包含：- 运镜流程及景别- 主体、动作- 场景描述- 光影与摄影- 道具/画面元素- 台词、音效

3.2 故事板生成器：shot2board-skill

功能：将分镜脚本（Markdown）转换为可视化故事板图片。

安装方式：创建Skill文件，保存到 ~/.openclaw/skills/shot2board-skill/SKILL.md

3.3 图片生成：media-chatgpt-image2

功能：通过 Coze 工作流根据提示词生成图片。

安装方式：将调用示例丢给小龙虾即可，他会保存到 ~/.openclaw/skills/media-chatgpt-image2/SKILL.md

API 参数：

参数	必填	默认值	说明
`prompt`	✅	–	图片描述提示词
`ratio`	❌	3:4	图片比例
`key`	❌	内置	固定 key
`images`	❌	–	参考图 URL 列表

调用示例：

curl -X POST 'https://api.coze.cn/v1/workflow/stream_run' \  -H "Authorization: Bearer YOUR_TOKEN" \  -H "Content-Type: application/json" \  -d '{    "workflow_id": "76343507d43840890",    "parameters": {      "key": "a7eab976-d4db-4993-ac9b",      "prompt": "你的图片描述...",      "ratio": "9:16"    }  }'

3.4 视频生成：media-seedance2-vedio

功能：通过 Coze 工作流根据提示词生成 Seedance2.0 视频。

⚠️ 费用较高，调用前务必确认参数无误，超时不重试。

安装方式：将调用示例丢给小龙虾即可，他保存到 ~/.openclaw/skills/media-seedance2-vedio/SKILL.md

API 参数：

参数	必填	默认值	说明
`prompt`	✅	–	视频描述提示词
`ratio`	❌	9:16	视频比例
`key`	❌	内置	固定 key
`image1` ~`image5`	❌	–	参考图（最多5张）
`audio1` ~`audio2`	❌	–	音频
`video1` ~`video2`	❌	–	参考视频

四、实战案例：小满文案生成短视频分镜

下面以小满的一段文案为例，完整演示整个流程。

4.1 原始文案

今天是小满，阳光刚好，风也不急。幸福从来不只是大事，它藏在最平凡的瞬间。我想让你不用熬夜，也能安心入睡；想让你在街角的小摊笑得自在，让未来无悔。多年以后，孩子可能记不得事情，但会记得——被爱着长大的感觉。等我们七十岁、八十岁，才艺不会了，但牵着手走在街上，依然有人为我们微笑。世界上最动人的温暖，从来不需要宏大。只是你在，我在，好好过每一天。辛苦了，我也爱你

4.2 第一步：生成电影感分镜脚本

调用 script2shot-skill，输入文案和参数：

主题

：平凡生活的温暖·小满时节
总时长

：50秒
分段时长

：10秒
视频比例

：9:16
旁白风格

：温柔轻声，治愈系
BGM类型

：温暖钢琴+弦乐

输出示例（片段1）：

## 片段1（0-10秒）｜小满的温柔开场### 镜头1A（0-5秒）- 运镜流程及景别：全景，缓慢横移- 主体：清晨阳光洒在普通街道- 动作：镜头缓缓推进，阳光穿过树叶光斑- 场景描述：小满时节，阳光刚好，老旧街道，风轻轻吹动树叶- 光影与摄影：逆光摄影，暖黄色调，柔焦光晕，16mm胶片质感- 道具/画面元素：阳光透过树叶的光斑、轻轻摇曳的树叶- 台词：今天是小满，阳光刚好，风也不急。- 音效：风声、远处鸟鸣、城市苏醒的微弱杂音### 镜头1B（5-10秒）- 运镜流程及景别：中景，固定机位- 主体：一家早餐小摊，蒸笼冒着热气- 动作：蒸汽缓缓升腾，路人悠闲走过- 场景描述：街角小摊，热气腾腾的早餐，平凡烟火气- 光影与摄影：自然光，暖色调，浅景深，胶片颗粒感- 道具/画面元素：蒸笼、热气、早餐、街道- 台词：幸福从来不只是大事，它藏在最平凡的瞬间。- 音效：街边嘈杂声、碗碟轻碰声、脚步声

完整输出共 5 个片段、10 个镜头，覆盖 50 秒视频。

4.3 第二步：生成故事板图片

将分镜脚本保存为 Markdown 文件，然后调用 media-chatgpt-image2 生成故事板。

中文提示词示例：

一部温暖治愈风微电影的专业分镜故事板，标题为"小满·温暖治愈分镜故事板 | 50秒 | 9:16竖屏"。整体布局：2列×5行网格结构，每个单元格代表一个镜头画面。每个单元格内部包含4行信息：第一行：片段标题+时间码第二行：镜头编号+时间+运镜方式+景别类型第三行：主体+动作+场景描述第四行：台词/旁白+音效视觉风格：轻柔暖色系，清晨柔光，低饱和暖色调，电影感胶片颗粒感10个镜头：第1行左侧：镜头1A，0-5秒，全景横移，清晨阳光洒在老旧街道，台词"今天是小满，阳光刚好，风也不急。"...（完整提示词略）

生成结果：

故事板图片会自动下载，包含完整的 10 个镜头可视化信息。

4.4 第三步：生成视频

如果需要直接生成视频，调用 media-seedance2-vedio。也可以拿着分镜提示词，和故事版图片去豆包、即梦平台的 seedance2.0 去生成。

⚠️ 重要提醒：

视频生成费用较高，调用前务必确认参数无误

建议先用低分辨率测试，确认效果后再生成正式版本

请求超时不要重试

告知小龙虾要生成哪个片段的视频，由于视频模型不能超过15秒，而整个故事板有50秒，需要分段生成视频，如何告知小龙虾，参考如下：

五、文件存储约定

建议统一管理生成的媒体文件：

类型	目录
图片	`/media/images`
视频	`/media/vedio`

六、注意事项

Token 管理：Coze API Token 属于敏感信息，请妥善保管，切勿泄露或提交到公开代码库。
费用控制：

media-chatgpt-image2

：图片生成，费用较低
media-seedance2-vedio

：Seedance2.0 视频，费用较高，调用前务必确认参数

超时处理：media-seedance2-vedio 超时后不要重试，避免重复扣费，超时时间设置：1200秒。
提示词优化：图片/视频生成质量很大程度上取决于提示词，建议：

中文描述尽量详细、具体
包含主体、动作、场景、光影、风格等信息
参考示例中的格式进行组织

比例选择：竖屏（9:16）适合抖音/快手；横屏（16:9）适合 YouTube/B站；方形（1:1）适合小红书。

七、总结

通过这套工作流，你可以：

文案 → AI 自动拆解成分镜脚本 → 可视化故事板 →  AI 生成视频

优势：

不需要剪辑基础
分镜脚本专业详细，包含运镜、光影、音效等电影级细节
全程 AI 辅助，效率大幅提升
支持多种视频比例和风格

适用场景：

短视频创作者快速生成脚本和分镜
视频策划阶段的可视化呈现
AI 生成视频的参考依据

关于作者

本教程由 AI李叔 整理，基于 OpenClaw + Coze 工作流实现。

如有问题，欢迎交流。