乐于分享
好东西不私藏

开源「AI 导演」工具:一句话生成完整短剧,角色不换脸、场景不穿帮

开源「AI 导演」工具:一句话生成完整短剧,角色不换脸、场景不穿帮

工业化工作流 × 关键帧精准控制,创作者的短剧神器


前言

AI 视频生成已经很强了,但做一部连贯的短剧,依然难如登天:

  • 角色换个镜头就”变脸”,完全不是同一个人
  • 每个镜头单独生成,前后场景光影对不上
  • 输入提示词,结果全靠运气——纯”开盲盒”

这些问题的根源在于:现有 AI 工具只擅长”生成单帧”,而不是”讲述故事”。

今天介绍一款专门解决这个问题的开源项目 —— BigBanana AI Director(AI 漫剧工场)。它将影视行业的工业化制作流程引入 AI 创作,让你像专业导演一样,从”一个灵感”到”一部成片”,全程可控、一气呵成。


项目简介

BigBanana AI Director 是一款面向创作者的开源 AI 短剧/漫剧生成平台。

区别于”输入提示词,等待惊喜”的传统方式,它采用 Script → Asset → Keyframe(剧本 → 资产 → 关键帧) 的工业化三段式工作流,将专业影视制作的核心逻辑移植到 AI 创作中:

核心能力
解决的问题
一句话生成完整剧本
不再面对空白输入框无从下手
角色一致性保障
彻底告别”角色换镜头就换脸”
场景连续性控制
解决光影不统一、前后穿帮问题
关键帧精准控制
每个镜头的起止状态完全可控

核心亮点

🎬 关键帧驱动,精准掌控每一帧

AI 视频”开盲盒”的根本原因,是你只能控制”输入”,无法控制”过程”。

BigBanana 引入动画制作中成熟的 关键帧(Keyframe) 机制:

  1. 先画后动:精确生成每个镜头的起始帧与结束帧
  2. AI 插值:模型在两帧之间生成流畅自然的视频过渡
  3. 资产约束:所有画面受”角色定妆照”和”场景概念图”双重约束,风格高度统一

结果:你知道镜头从哪里开始,也知道它在哪里结束。创作变得可预期、可迭代。

👥 角色一致性系统

角色”换镜头就换脸”,是 AI 短剧最难解决的痛点之一。BigBanana 的解法:

  • 定妆照系统:为每个角色生成标准参考图,作为所有镜头的视觉锚点
  • 衣橱系统:支持多套造型(日常、战斗、受伤……),在保持面部特征一致的前提下灵活切换服装
  • 上下文感知:生成镜头时,系统自动读取当前场景的角色与场景信息,无需手动重复输入

🎯 四阶段工业化流程

整个创作流程对应影视制作的四个标准环节,清晰、可复用:

阶段
功能
说明
Phase 01
剧本与分镜
输入故事创意,AI 自动生成标准剧本结构与分镜脚本
Phase 02
资产与选角
生成角色定妆照、服装造型与场景概念图
Phase 03
导演工作台
网格化管理所有镜头,精准编辑关键帧
Phase 04
成片导出
时间轴预览,一键渲染导出

功能演示

1️⃣ 项目管理

在项目管理页面创建和管理你的短剧项目,每个项目独立存储、随时续做。

2️⃣ Phase 01:剧本与分镜

输入一句故事创意或一段小说片段,AI 会自动完成:

  • 拆解为标准剧本结构(场次、时间、情绪氛围)
  • 生成分镜脚本,规划每个镜头的叙事节奏
  • 将文字描述转化为专业图像提示词,供后续生成使用

3️⃣ Phase 02:角色与场景资产

这是保障角色一致性的关键环节,也是 BigBanana 区别于普通 AI 工具的核心所在:

  • 为每个角色生成”定妆照”,作为全片的视觉参考标准
  • 支持配置多套服装造型,满足不同剧情场景
  • 生成场景概念图,确保全片光影风格统一

4️⃣ Phase 03:导演工作台

整个系统的核心。这里是你和 AI 共同”导戏”的地方:

  • 网格化分镜表:全景式管理所有镜头,进度一目了然
  • 关键帧编辑:独立控制每个镜头的起始帧与结束帧
  • 上下文感知生成:AI 自动读取当前场景的角色与场景资产,解决”不连戏”问题
  • 双模式视频生成:支持 Image-to-Video(图生视频)和关键帧插值两种模式

5️⃣ Phase 04:成片导出

最后一步,预览与导出:

  • 时间轴形式预览完整短剧,快速审查节奏
  • 实时监控渲染进度
  • 支持导出高清关键帧图片和 MP4 视频片段

📝 提示词管理

系统内置提示词管理模块,方便你查看、编辑和优化 AI 生成的每一条提示词,让创作过程透明可控:


技术架构

模块
技术选型
前端框架
React 19 + Tailwind CSS
文本模型
GPT-5.1(剧本分析与提示词生成)
图像模型
Gemini 3 Pro(角色/场景图生成)
视频模型
Veo 3.1 / Sora 2(关键帧插值与视频合成)
数据存储
IndexedDB(浏览器本地存储)

值得一提:所有创作数据存储在用户本地浏览器中,无需后端服务器,项目隐私完全由你掌控。


快速开始

方式一:在线预览

直接访问:https://director.tree456.com/

方式二:Docker 部署(推荐)

git clone https://github.com/shuyu-labs/BigBanana-AI-Director.gitcd BigBanana-AI-Directordocker-compose up -d --build# 访问 http://localhost:3005

使用步骤

  1. 配置 API Key:启动应用后,填入 AntSK API Key
  2. 输入故事:在 Phase 01 输入故事创意或小说片段
  3. 生成资产:在 Phase 02 为角色和场景生成视觉参考
  4. 制作分镜:在 Phase 03 逐镜头生成并编辑关键帧
  5. 导出成片:在 Phase 04 预览时间轴,导出视频

为什么选择 AntSK API?

本项目深度集成 AntSK API 平台,统一接入主流 AI 模型:

  • 全模型覆盖:GPT-5.2、Claude 3.5、Gemini 3 Pro、Sora 2、Veo 3.1 一站接入
  • 极具竞争力的定价:主流模型价格低于官方渠道 80%
  • 零迁移成本:完全兼容 OpenAI 协议,现有代码直接复用

👉 注册 AntSK 领取免费额度


项目地址

GitHub:https://github.com/shuyu-labs/BigBanana-AI-Director

⭐ 如果觉得有用,欢迎 Star 支持!


写在最后

AI 让每个人都有机会成为导演。但”生成一帧”和”讲好一个故事”之间,鸿沟依然巨大。

BigBanana AI Director 想填平的,正是这个鸿沟 —— 用工业化的创作流程,让 AI 真正成为创作者的助手,而不是一个随机的内容生成器。

如果你有想做的短剧、漫剧或动画故事板,不妨试试这个工具。

GitHub:https://github.com/shuyu-labs/BigBanana-AI-Director

欢迎 Star、Fork,也欢迎提 Issue 共同完善这个项目。


Built for Creators, by BigBanana.

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 开源「AI 导演」工具:一句话生成完整短剧,角色不换脸、场景不穿帮

猜你喜欢

  • 暂无文章