乐于分享
好东西不私藏

AI实战:从0到成片,我用OpenClaw一键生成分镜→故事板→视频,全程详解

AI实战:从0到成片,我用OpenClaw一键生成分镜→故事板→视频,全程详解

今天折腾了一套用 OpenClaw 生成短视频的完整工作流:从一段文案出发,AI 自动拆解成分镜脚本,再生成可视化的故事板图片,最后还能直接生成视频。

个过程不需要太多干预,只要你会写文案,就能做出电影感的视频,效果如下。

下面把完整流程整理成教程,小白也能参考搭建出来。另外本教程涉及的Coze工作流搭建部分,可以参考我的其他文章。


一、整体工作流程

文案/剧情梗概    ↓分镜脚本(AI 自动拆解:运镜、景别、动作、光影、音效)    ↓故事板图片(Chatgpt Image2 可视化分镜,9:16 / 21:9 等比例)    ↓视频(Seedance2.0,参考故事板拍摄或直接 AI 生成)

核心工具:OpenClaw + Coze 工作流

核心模型:Seedance2.0 + Chatgpt Image2 + Minimax2.7


二、前置准备

2.1 环境要求

  • OpenClaw
     已部署并正常运行
  • Coze 账号
    :需要获取 API Token(JWT 格式)
  • Coze 工作流
    :提前创建好两个工作流(也可以其他API直接调用)
    • media-chatgpt-image2
      :图片生成工作流(workflow_id: 76343507547840890)
    • media-seedance2-vedio
      :视频生成工作流(workflow_id: 76393348946260438)

2.2 获取 Coze API Token

  1. 登录 coze.cn
  2. 点击「扣子编程」→ 点击「资源库」→ 右上角的「资源」→ 选择「工作流」→右上角选「API」
  3. 创建一个 Access Token(JWT 格式,类似于 eyJhbGciOiJIUzI1NiIsInR5cCI6IkpVCJ9...
  4. 将 Token 记录下来,后续调用 API 时使用

⚠️ Token 属于敏感信息,请勿泄露。


三、安装 OpenClaw Skill

OpenClaw 通过 Skill 扩展能力。我们需要安装两个核心 Skill:

3.1 分镜脚本生成器:script2shot-skill

功能:输入文案和基础参数,自动电影感分镜脚本。

安装方式:将以下内容丢给小龙虾,它会帮创建skill, 文件保存到 ~/.opennclaw/skills/script2shot-skill/SKILL.md

# Skill: 电影感分镜生成器## 输入参数- 主题、视频总时长、分段时长、视频比例- 旁白风格、BGM类型、画面元素- 剧本/剧情梗概## 输出每段默认 10 秒,每段 2~3 个镜头,每个镜头包含:- 运镜流程及景别- 主体、动作- 场景描述- 光影与摄影- 道具/画面元素- 台词、音效

3.2 故事板生成器:shot2board-skill

功能:将分镜脚本(Markdown)转换为可视化故事板图片。

安装方式:创建Skill文件,保存到 ~/.openclaw/skills/shot2board-skill/SKILL.md

3.3 图片生成:media-chatgpt-image2

功能:通过 Coze 工作流根据提示词生成图片。

安装方式: 将调用示例丢给小龙虾即可,他会保存到 ~/.openclaw/skills/media-chatgpt-image2/SKILL.md

API 参数

参数
必填
默认值
说明
prompt
图片描述提示词
ratio
3:4
图片比例
key
内置
固定 key
images
参考图 URL 列表

调用示例

curl -X POST 'https://api.coze.cn/v1/workflow/stream_run' \  -H "Authorization: Bearer YOUR_TOKEN" \  -H "Content-Type: application/json" \  -d '{    "workflow_id": "76343507d43840890",    "parameters": {      "key": "a7eab976-d4db-4993-ac9b",      "prompt": "你的图片描述...",      "ratio": "9:16"    }  }'

3.4 视频生成:media-seedance2-vedio

功能:通过 Coze 工作流根据提示词生成 Seedance2.0 视频。

⚠️ 费用较高,调用前务必确认参数无误,超时不重试。

安装方式:将调用示例丢给小龙虾即可,他保存到 ~/.openclaw/skills/media-seedance2-vedio/SKILL.md

API 参数

参数
必填
默认值
说明
prompt
视频描述提示词
ratio
9:16
视频比例
key
内置
固定 key
image1

~image5
参考图(最多5张)
audio1

~audio2
音频
video1

~video2
参考视频

四、实战案例:小满文案生成短视频分镜

下面以小满的一段文案为例,完整演示整个流程。

4.1 原始文案

今天是小满,阳光刚好,风也不急。幸福从来不只是大事,它藏在最平凡的瞬间。我想让你不用熬夜,也能安心入睡;想让你在街角的小摊笑得自在,让未来无悔。多年以后,孩子可能记不得事情,但会记得——被爱着长大的感觉。等我们七十岁、八十岁,才艺不会了,但牵着手走在街上,依然有人为我们微笑。世界上最动人的温暖,从来不需要宏大。只是你在,我在,好好过每一天。辛苦了,我也爱你

4.2 第一步:生成电影感分镜脚本

调用 script2shot-skill,输入文案和参数:

  • 主题
    :平凡生活的温暖·小满时节
  • 总时长
    :50秒
  • 分段时长
    :10秒
  • 视频比例
    :9:16
  • 旁白风格
    :温柔轻声,治愈系
  • BGM类型
    :温暖钢琴+弦乐

输出示例(片段1):

## 片段1(0-10秒)|小满的温柔开场### 镜头1A(0-5秒)- 运镜流程及景别:全景,缓慢横移- 主体:清晨阳光洒在普通街道- 动作:镜头缓缓推进,阳光穿过树叶光斑- 场景描述:小满时节,阳光刚好,老旧街道,风轻轻吹动树叶- 光影与摄影:逆光摄影,暖黄色调,柔焦光晕,16mm胶片质感- 道具/画面元素:阳光透过树叶的光斑、轻轻摇曳的树叶- 台词:今天是小满,阳光刚好,风也不急。- 音效:风声、远处鸟鸣、城市苏醒的微弱杂音### 镜头1B(5-10秒)- 运镜流程及景别:中景,固定机位- 主体:一家早餐小摊,蒸笼冒着热气- 动作:蒸汽缓缓升腾,路人悠闲走过- 场景描述:街角小摊,热气腾腾的早餐,平凡烟火气- 光影与摄影:自然光,暖色调,浅景深,胶片颗粒感- 道具/画面元素:蒸笼、热气、早餐、街道- 台词:幸福从来不只是大事,它藏在最平凡的瞬间。- 音效:街边嘈杂声、碗碟轻碰声、脚步声

完整输出共 5 个片段、10 个镜头,覆盖 50 秒视频。

4.3 第二步:生成故事板图片

将分镜脚本保存为 Markdown 文件,然后调用 media-chatgpt-image2 生成故事板。

中文提示词示例

一部温暖治愈风微电影的专业分镜故事板,标题为"小满·温暖治愈分镜故事板 | 50秒 | 9:16竖屏"。整体布局:2列×5行网格结构,每个单元格代表一个镜头画面。每个单元格内部包含4行信息:第一行:片段标题+时间码第二行:镜头编号+时间+运镜方式+景别类型第三行:主体+动作+场景描述第四行:台词/旁白+音效视觉风格:轻柔暖色系,清晨柔光,低饱和暖色调,电影感胶片颗粒感10个镜头:第1行左侧:镜头1A,0-5秒,全景横移,清晨阳光洒在老旧街道,台词"今天是小满,阳光刚好,风也不急。"...(完整提示词略)

生成结果

故事板图片会自动下载,包含完整的 10 个镜头可视化信息。

4.4 第三步:生成视频

如果需要直接生成视频,调用 media-seedance2-vedio。也可以拿着分镜提示词,和故事版图片去豆包、即梦平台的 seedance2.0 去生成。

⚠️ 重要提醒

  1. 视频生成费用较高,调用前务必确认参数无误
  2. 建议先用低分辨率测试,确认效果后再生成正式版本
  3. 请求超时不要重试
告知小龙虾要生成哪个片段的视频,由于视频模型不能超过15秒, 而整个故事板有50秒, 需要分段生成视频,如何告知小龙虾,参考如下:
五、文件存储约定

建议统一管理生成的媒体文件:

类型
目录
图片
/media/images
视频
/media/vedio

六、注意事项

  1. Token 管理:Coze API Token 属于敏感信息,请妥善保管,切勿泄露或提交到公开代码库。

  2. 费用控制

    • media-chatgpt-image2
      :图片生成,费用较低
    • media-seedance2-vedio
      :Seedance2.0 视频,费用较高,调用前务必确认参数
  3. 超时处理media-seedance2-vedio 超时后不要重试,避免重复扣费,超时时间设置:1200秒。

  4. 提示词优化:图片/视频生成质量很大程度上取决于提示词,建议:

    • 中文描述尽量详细、具体
    • 包含主体、动作、场景、光影、风格等信息
    • 参考示例中的格式进行组织
  5. 比例选择:竖屏(9:16)适合抖音/快手;横屏(16:9)适合 YouTube/B站;方形(1:1)适合小红书。


七、总结

通过这套工作流,你可以:

文案 → AI 自动拆解成分镜脚本 → 可视化故事板 →  AI 生成视频

优势

  • 不需要剪辑基础
  • 分镜脚本专业详细,包含运镜、光影、音效等电影级细节
  • 全程 AI 辅助,效率大幅提升
  • 支持多种视频比例和风格

适用场景

  • 短视频创作者快速生成脚本和分镜
  • 视频策划阶段的可视化呈现
  • AI 生成视频的参考依据

关于作者

本教程由 AI李叔 整理,基于 OpenClaw + Coze 工作流实现。

如有问题,欢迎交流。