
最近,我把一个正在做的 AI 创作项目整理并开源了。
项目叫 AI Creator Studio,它的目标很明确:让一个产品从“商品信息”出发,自动走完短视频创意生产的核心流程。
也就是:
产品信息 → 营销策略 → 分镜脚本 → 关键帧图片 → 视频片段 → 视频合成
如果你做过电商短视频、TikTok 素材、商品种草内容,应该会很熟悉这个流程。真正耗时间的,往往不是单点生成一张图或一段视频,而是前面的策略拆解、脚本设计、镜头规划、Prompt 优化,以及后续素材的反复调整。
AI Creator Studio 想解决的正是这条链路。

为什么做这个项目?
现在 AI 生图、AI 视频工具很多,但大多数还是“单点工具”。
你输入一句 Prompt,它给你一张图;你上传一张图,它给你一段视频。
这些能力很强,但对于真实的视频创作来说,还不够完整。
一个可用的短视频素材,通常需要先回答这些问题:
• 这个产品卖给谁? • 前 3 秒怎么抓人? • 应该强调痛点、场景,还是效果对比? • 每个镜头分别拍什么? • 图像 Prompt 怎么写才稳定? • 视频 Prompt 怎么写才有动作? • 多个镜头怎么拼成完整视频?
所以我做了一个更接近“创作工作流”的系统,而不是单独的 AI 生成按钮。
AI Creator Studio 能做什么?
目前这个开源版本包含几个核心模块。
第一步是产品配置。用户可以输入产品标题、产品卖点、目标市场、创意方向,也可以上传产品图、模特图和参考视频。
第二步是 AI 策略分析。系统会根据产品信息生成营销策略,包括风险等级、文化背景、核心打法和开场钩子。
第三步是分镜脚本生成。系统会自动生成多个镜头,每个镜头包含画面描述、动作设计、运镜方式、中文摘要、英文图像 Prompt,以及用于视频生成的 Manifest 配置。
第四步是图片和视频生成。项目预留了多种模型接口,可以接入 Flux、Google Nano Banana、Runway、Kling、Google VEO 等图像或视频生成服务。
最后是视频合并。多个分镜视频片段可以通过 ffmpeg 合成为完整视频。先看看效果:
技术栈
项目采用前后端分离架构。
前端使用:
• Vue 3 • Vite • Pinia • Vue Router • Tailwind CSS • Lucide Vue
后端使用:
• Python • FastAPI • Pydantic • HTTPX • OpenAI SDK
整体结构比较轻,适合二次开发、快速实验,也适合拿来研究 AI 视频工作流产品怎么搭。
这个项目适合谁?
如果你是开发者,可以把它当作一个 AI 应用项目模板,研究前后端如何组织 AI 工作流。
如果你是跨境电商卖家、内容运营或者短视频团队,可以基于它改造成自己的素材生产工具。
如果你正在关注 AI Agent、AI 工作流、AIGC 视频生产,也可以看看这个项目里如何把“策略、脚本、图片、视频”串成一个完整链路。
开源不是终点
这个项目目前还是一个早期版本,很多地方都可以继续增强。
比如:
• 更稳定的任务队列 • 更完整的用户系统 • 更好的素材资产管理 • 更细的分镜编辑体验 • 更多视频模型接入 • 自动配音、字幕、BGM • 批量生成和效果评估
但我觉得,先把它开源出来,比一直关在本地更有价值。
开源项目最有意思的地方,不是它一开始就完美,而是它可以被看见、被使用、被修改、被继续推进。
项目地址
GitHub 地址:
https://github.com/harvey503/AI-Creator-Studio
欢迎 Star、Fork,也欢迎一起交流 AI 视频创作工具的产品形态和技术实现。
如果你也在做 AI 创作、跨境电商素材、短视频自动化,或许这个项目能给你一点启发。
夜雨聆风