AI实战:从0到成片,我用OpenClaw一键生成分镜→故事板→视频,全程详解
今天折腾了一套用 OpenClaw 生成短视频的完整工作流:从一段文案出发,AI 自动拆解成分镜脚本,再生成可视化的故事板图片,最后还能直接生成视频。
整个过程不需要太多干预,只要你会写文案,就能做出电影感的视频,效果如下。
下面把完整流程整理成教程,小白也能参考搭建出来。另外本教程涉及的Coze工作流搭建部分,可以参考我的其他文章。
一、整体工作流程
文案/剧情梗概 ↓分镜脚本(AI 自动拆解:运镜、景别、动作、光影、音效) ↓故事板图片(Chatgpt Image2 可视化分镜,9:16 / 21:9 等比例) ↓视频(Seedance2.0,参考故事板拍摄或直接 AI 生成)
核心工具:OpenClaw + Coze 工作流
核心模型:Seedance2.0 + Chatgpt Image2 + Minimax2.7
二、前置准备
2.1 环境要求
- OpenClaw
已部署并正常运行 - Coze 账号
:需要获取 API Token(JWT 格式) - Coze 工作流
:提前创建好两个工作流(也可以其他API直接调用) media-chatgpt-image2
:图片生成工作流(workflow_id: 76343507547840890) media-seedance2-vedio
:视频生成工作流(workflow_id: 76393348946260438)
2.2 获取 Coze API Token
-
登录 coze.cn -
点击「扣子编程」→ 点击「资源库」→ 右上角的「资源」→ 选择「工作流」→右上角选「API」 
-
创建一个 Access Token(JWT 格式,类似于 eyJhbGciOiJIUzI1NiIsInR5cCI6IkpVCJ9...)


-
将 Token 记录下来,后续调用 API 时使用
⚠️ Token 属于敏感信息,请勿泄露。
三、安装 OpenClaw Skill
OpenClaw 通过 Skill 扩展能力。我们需要安装两个核心 Skill:
3.1 分镜脚本生成器:script2shot-skill
功能:输入文案和基础参数,自动电影感分镜脚本。
安装方式:将以下内容丢给小龙虾,它会帮创建skill, 文件保存到 ~/.opennclaw/skills/script2shot-skill/SKILL.md
# Skill: 电影感分镜生成器## 输入参数- 主题、视频总时长、分段时长、视频比例- 旁白风格、BGM类型、画面元素- 剧本/剧情梗概## 输出每段默认 10 秒,每段 2~3 个镜头,每个镜头包含:- 运镜流程及景别- 主体、动作- 场景描述- 光影与摄影- 道具/画面元素- 台词、音效

3.2 故事板生成器:shot2board-skill
功能:将分镜脚本(Markdown)转换为可视化故事板图片。
安装方式:创建Skill文件,保存到 ~/.openclaw/skills/shot2board-skill/SKILL.md

3.3 图片生成:media-chatgpt-image2
功能:通过 Coze 工作流根据提示词生成图片。
安装方式: 将调用示例丢给小龙虾即可,他会保存到 ~/.openclaw/skills/media-chatgpt-image2/SKILL.md
API 参数:
|
|
|
|
|
|---|---|---|---|
prompt |
|
|
|
ratio |
|
|
|
key |
|
|
|
images |
|
|
|
调用示例:
curl -X POST 'https://api.coze.cn/v1/workflow/stream_run' \ -H "Authorization: Bearer YOUR_TOKEN" \ -H "Content-Type: application/json" \ -d '{ "workflow_id": "76343507d43840890", "parameters": { "key": "a7eab976-d4db-4993-ac9b", "prompt": "你的图片描述...", "ratio": "9:16" } }'
3.4 视频生成:media-seedance2-vedio
功能:通过 Coze 工作流根据提示词生成 Seedance2.0 视频。
⚠️ 费用较高,调用前务必确认参数无误,超时不重试。
安装方式:将调用示例丢给小龙虾即可,他保存到 ~/.openclaw/skills/media-seedance2-vedio/SKILL.md
API 参数:
|
|
|
|
|
|---|---|---|---|
prompt |
|
|
|
ratio |
|
|
|
key |
|
|
|
image1
image5 |
|
|
|
audio1
audio2 |
|
|
|
video1
video2 |
|
|
|
四、实战案例:小满文案生成短视频分镜
下面以小满的一段文案为例,完整演示整个流程。
4.1 原始文案
今天是小满,阳光刚好,风也不急。幸福从来不只是大事,它藏在最平凡的瞬间。我想让你不用熬夜,也能安心入睡;想让你在街角的小摊笑得自在,让未来无悔。多年以后,孩子可能记不得事情,但会记得——被爱着长大的感觉。等我们七十岁、八十岁,才艺不会了,但牵着手走在街上,依然有人为我们微笑。世界上最动人的温暖,从来不需要宏大。只是你在,我在,好好过每一天。辛苦了,我也爱你
4.2 第一步:生成电影感分镜脚本
调用 script2shot-skill,输入文案和参数:
- 主题
:平凡生活的温暖·小满时节 - 总时长
:50秒 - 分段时长
:10秒 - 视频比例
:9:16 - 旁白风格
:温柔轻声,治愈系 - BGM类型
:温暖钢琴+弦乐
输出示例(片段1):
## 片段1(0-10秒)|小满的温柔开场### 镜头1A(0-5秒)- 运镜流程及景别:全景,缓慢横移- 主体:清晨阳光洒在普通街道- 动作:镜头缓缓推进,阳光穿过树叶光斑- 场景描述:小满时节,阳光刚好,老旧街道,风轻轻吹动树叶- 光影与摄影:逆光摄影,暖黄色调,柔焦光晕,16mm胶片质感- 道具/画面元素:阳光透过树叶的光斑、轻轻摇曳的树叶- 台词:今天是小满,阳光刚好,风也不急。- 音效:风声、远处鸟鸣、城市苏醒的微弱杂音### 镜头1B(5-10秒)- 运镜流程及景别:中景,固定机位- 主体:一家早餐小摊,蒸笼冒着热气- 动作:蒸汽缓缓升腾,路人悠闲走过- 场景描述:街角小摊,热气腾腾的早餐,平凡烟火气- 光影与摄影:自然光,暖色调,浅景深,胶片颗粒感- 道具/画面元素:蒸笼、热气、早餐、街道- 台词:幸福从来不只是大事,它藏在最平凡的瞬间。- 音效:街边嘈杂声、碗碟轻碰声、脚步声
完整输出共 5 个片段、10 个镜头,覆盖 50 秒视频。
4.3 第二步:生成故事板图片
将分镜脚本保存为 Markdown 文件,然后调用 media-chatgpt-image2 生成故事板。
中文提示词示例:
一部温暖治愈风微电影的专业分镜故事板,标题为"小满·温暖治愈分镜故事板 | 50秒 | 9:16竖屏"。整体布局:2列×5行网格结构,每个单元格代表一个镜头画面。每个单元格内部包含4行信息:第一行:片段标题+时间码第二行:镜头编号+时间+运镜方式+景别类型第三行:主体+动作+场景描述第四行:台词/旁白+音效视觉风格:轻柔暖色系,清晨柔光,低饱和暖色调,电影感胶片颗粒感10个镜头:第1行左侧:镜头1A,0-5秒,全景横移,清晨阳光洒在老旧街道,台词"今天是小满,阳光刚好,风也不急。"...(完整提示词略)
生成结果:
故事板图片会自动下载,包含完整的 10 个镜头可视化信息。

4.4 第三步:生成视频
如果需要直接生成视频,调用 media-seedance2-vedio。也可以拿着分镜提示词,和故事版图片去豆包、即梦平台的 seedance2.0 去生成。
⚠️ 重要提醒:
视频生成费用较高,调用前务必确认参数无误 建议先用低分辨率测试,确认效果后再生成正式版本 请求超时不要重试

建议统一管理生成的媒体文件:
|
|
|
|---|---|
|
|
/media/images |
|
|
/media/vedio |
六、注意事项
-
Token 管理:Coze API Token 属于敏感信息,请妥善保管,切勿泄露或提交到公开代码库。
-
费用控制:
media-chatgpt-image2
:图片生成,费用较低 media-seedance2-vedio
:Seedance2.0 视频,费用较高,调用前务必确认参数 -
超时处理:
media-seedance2-vedio超时后不要重试,避免重复扣费,超时时间设置:1200秒。 -
提示词优化:图片/视频生成质量很大程度上取决于提示词,建议:
-
中文描述尽量详细、具体 -
包含主体、动作、场景、光影、风格等信息 -
参考示例中的格式进行组织 -
比例选择:竖屏(9:16)适合抖音/快手;横屏(16:9)适合 YouTube/B站;方形(1:1)适合小红书。
七、总结
通过这套工作流,你可以:
文案 → AI 自动拆解成分镜脚本 → 可视化故事板 → AI 生成视频
优势:
-
不需要剪辑基础 -
分镜脚本专业详细,包含运镜、光影、音效等电影级细节 -
全程 AI 辅助,效率大幅提升 -
支持多种视频比例和风格
适用场景:
-
短视频创作者快速生成脚本和分镜 -
视频策划阶段的可视化呈现 -
AI 生成视频的参考依据
关于作者
本教程由 AI李叔 整理,基于 OpenClaw + Coze 工作流实现。
如有问题,欢迎交流。
夜雨聆风