前阵子有个朋友给我发了一条消息,说他在 B 站刷到一条赛博朋克风格的武侠短剧,画面美到截图当壁纸,剧情紧凑到一口气刷完八集。他问我:"这种视频,一个人能做出来吗?"
我的回答是:能。而且有了 AI 工具之后,制作起来比你想的要简单些。
做 AI 视频这件事,其实跟做饭特别像。你不需要从种稻子开始,菜市场( AI 工具)已经帮你把食材备好了。你要做的就是选对菜谱(脚本),把配菜切好(分镜),然后调火候(提示词),上锅翻炒( AI 生成),最后摆个盘(后期剪辑)。当然,跟做饭一样,前几次大概率会翻车,但没关系,多炒几次就顺手了。
今天这期,我就用一套完整的 5 步工作流,带你从零做出一条赛博朋克武侠短剧。我会把每一步的提示词模板都给你,直接复制就能用。

我们的案例短剧叫《霓虹剑客》,讲的是一个机械义体的剑客,在未来都市的霓虹灯下寻找师父遗言的故事。风格上我想往徐克的侠气加银翼杀手的光影那个方向靠——当然最后能做到几成,说实话我心里也没底。一个孤独的剑客在霓虹丛林里狂奔,光是想想这个画面,我就觉得挺带劲的。
第一步:创意脚本——给你的短剧写一份"菜谱"

做菜得先有菜谱,做视频得先有脚本。很多人一上来就打开 AI 工具开始生成画面,结果生成了一堆好看的碎片,拼在一起却讲不成一个故事。
脚本不需要写得多复杂,但你得交代清楚几件事:主角是谁、在什么地方、要干什么。其实就跟跟朋友讲一个故事一样,这三件事说不清,听的人就会一脸懵。
我一般用 AI 来帮我头脑风暴,把一个模糊的想法变成一个有头有尾的故事大纲。说实话,我第一次用 AI 写脚本的时候,出来的东西简直惨不忍睹——主角三句话还没说完就开始谈恋爱,反派的存在感比路人甲还低,剧情逻辑碎得跟拼图少了半块似的。后来死磕了两个晚上,反复调提示词,才终于摸到门道。下面这个提示词模板,就是我反复调过很多次之后固定下来的:
【提示词模板 1 :故事大纲生成】
你是一位擅长创作赛博朋克武侠题材的编剧。请根据以下核心概念,创作一个 3 分钟短剧的故事大纲:
核心概念:[一个失去左臂的剑客,装上机械义肢后,在未来都市"新洛阳"的霓虹灯下寻找师父留下的最后一招剑法]
要求:1. 分为 3 幕结构(起因-冲突-高潮)2. 主角有一个明确的情感动机3. 包含至少 2 个反转4. 风格参考:徐克《新龙门客栈》的侠义感 + 电影《银翼杀手 2049 》的视觉氛围5. 每幕用 2-3 句话概括
拿到大纲之后,我会再让它把每一幕细化成具体的场景描述:
【提示词模板 2 :场景细化】
请将以下故事大纲的每一幕,拆解为 2-3 个具体场景。每个场景需要包含:1. 场景编号和地点2. 画面描述( 50 字以内)3. 角色动作和情绪4. 关键道具5. 氛围关键词( 3-5 个)
故事大纲:[粘贴上一步生成的大纲]
这一步做完,你就拥有了一份完整的"菜谱"。我习惯把脚本打印出来,在旁边手写标注哪些画面是关键镜头、哪些地方需要特效。不知道为什么,拿笔在纸上画圈打钩的时候,脑子会比盯着屏幕的时候清醒很多,可能是手写这个东西天然就让人慢下来吧。
第二步:分镜拆解——把故事"切"成一个个镜头

菜谱有了,接下来要切配菜。分镜表就是你的"切菜板"。
分镜这个词听起来很专业,但别被它吓到。说白了,就是把脚本里的每个场景,拆成一个一个具体的镜头画面。你不需要画分镜图(当然会画更好),只需要用文字把每个镜头描述清楚就够了。
我用的方法是:一个场景 = 2-5 个镜头,每个镜头用一句话描述。
【提示词模板 3 :分镜表生成】
你是一位专业的影视分镜师。请将以下场景描述拆解为具体的分镜表,格式如下:
| 镜头号 | 景别 | 运镜 | 画面描述 | 时长 | 音效/配乐 |
景别选项:特写(CU)、近景(MS)、中景(MLS)、远景(WS)、大远景(EWS)运镜选项:固定、推、拉、摇、移、跟、航拍
场景描述:[粘贴场景描述]
要求:1. 每个场景拆解为 3-5 个镜头2. 注意景别变化,避免连续相同景别3. 张艺谋式构图:善用对称和框架构图4. 每个镜头时长控制在 2-5 秒
这一步我通常会花比较多的时间去调整。因为分镜表的质量,直接决定了后面 AI 生成的画面能不能用。分镜写得越细,后面返工的概率就越低——这个道理谁都懂,但做的时候还是会偷懒,我到现在也偶尔会翻这个错。
我有一个小习惯:在分镜表里给每个镜头标注"情绪值",从 1 到 10 分。这样后面生成画面的时候,你就知道哪个镜头需要浓墨重彩,哪个镜头需要留白。
【提示词模板 4 :单镜头画面描述优化】
请将以下镜头描述优化为 AI 视频生成工具可以直接使用的画面描述,要求:1. 加入具体的视觉细节(光影、色彩、材质)2. 加入电影摄影语言(景深、焦段、机位)3. 保持赛博朋克+武侠的混搭风格4. 描述控制在 80 字以内
原始镜头描述:[粘贴镜头描述]
第三步:提示词编写——调好你的"火候"

到了这一步,很多人会犯一个错误:把分镜描述直接丢给 AI 工具,然后抱怨生成的画面不好看。
这就好比你把一堆食材扔进锅里,不调火候不放调料,端出来当然不好吃。
提示词就是你的火候和调料。 同样的 AI 工具,提示词写得好的和写得差的,出来的东西你一看就知道——一个像电影截图,一个像 PPT 配图。
下面我分享几个我实战中总结出来的提示词模板,覆盖不同类型的镜头:
【提示词模板 5 :角色出场镜头】
[角色描述] standing in [环境描述], [光影描述], cyberpunk wuxia, neon reflecting on [角色特征], cinematic wide shot, dolly forward, shallow depth of field, [主色调] palette, Zhang Yimou composition --ar 16:9
【提示词模板 6 :动作打斗镜头】
[角色] performing [具体动作,如"挥剑斩断霓虹灯牌"], dynamic action pose, motion blur on [运动部位], sparks and debris flying, cyberpunk city street background, rain, neon reflections on wet ground, Tsui Hark action cinema style, high speed photography, dramatic lighting, ultra detailed, --ar 16:9
【提示词模板 7 :情绪特写镜头】
Extreme close-up of [角色面部特征], [情绪描述], single tear, rain on skin, mechanical parts visible, melancholic, bokeh neon background, Wong Kar-wai lighting, anamorphic flare --ar 16:9
【提示词模板 8 :环境空镜头】
[环境描述] skyline, pagodas with holographic billboards, flying cars, mist and neon glow, cyberpunk oriental, golden hour, Blade Runner meets Crouching Tiger, ultra wide aerial shot --ar 16:9
写提示词有一个核心技巧:先写中文想清楚你要什么,再翻译成英文给 AI 。 因为目前主流的 AI 视频工具对英文提示词的理解力更强。但你的创意思考过程,用母语会更顺畅。
别看我现在给你列了一堆模板,写的时候可没那么顺。光那个角色出场镜头的提示词,我前前后后改了三版都不满意——第一版人物像塑料假人,第二版背景糊成一团色块,第三版直接给我生成了一个科幻士兵,跟武侠半毛钱关系都没有。当时气得差点把键盘砸了,关了电脑出去走了半小时才冷静下来,回来又硬着头皮一帧一帧地调参数。
这就像你心里想的是红烧肉的味道,但跟厨师沟通的时候得用他能听懂的语言。
第四步: AI 生成——上锅翻炒

食材备好了,火候调好了,现在可以开火了。
这一步我会用到几个核心工具,各有各的活儿:
Seedance (即梦)是我用得最多的一个,主要用来生成角色一致的人物画面。它有个角色参考功能,你上传一张角色设定图,后面生成的画面里角色长相就能保持一致。对短剧来说这个太重要了,角色每换一个镜头就变一张脸,观众直接出戏。
可灵 AI我专门留给动作镜头。它生成的打斗画面肢体不会扭曲穿模,这一点比很多同类工具强。徐克式的飞檐走壁、剑气纵横,用可灵来生成就对了。不过它也不是万能的,复杂的多人对打偶尔还是会翻车,后面我会说到。
通义万相的话,环境场景和空镜头我基本都丢给它。它对中国风元素的理解确实到位,你跟它说"飞檐翘角的赛博朋克酒楼",它真的能给你一个既有东方韵味又有未来感的建筑,不会变成纯西式的科幻大楼。
【提示词模板 9 : Seedance 角色一致性生成】
角色:[角色名],参考图已上传场景:[场景描述]动作:[角色在做什么]风格: cyberpunk wuxia, cinematic, [光影描述]运镜:[运镜方式]保持与参考图一致的面部特征、服装和体型
【提示词模板 10 :可灵 AI 动作镜头生成】
一个[角色描述]在[环境]中[具体动作描述]。镜头[运镜方式],[速度描述,如"慢动作 0.5x"]。注意物理真实感:衣摆飘动方向与运动方向一致,剑刃反光随角度变化,地面水花溅起符合力学。赛博朋克武侠风格,电影级画质。
实际生成的时候,我一般会每个镜头生成 3-5 个版本,然后从中选最好的那个。这就像炒菜要尝味道一样,多试几次才能找到最合适的。
说"多试几次"是客气了。做《霓虹剑客》的时候,光第二幕那个雨夜打斗的镜头,我一口气生成了二十多个版本,能用的不到两个。剩下的全是废片——有的剑客六根手指,有的雨是往天上下的,还有一个版本剑客直接穿模穿进了地面,只剩半个脑袋露在外面。那天晚上我盯着屏幕看了很久,真的差点放弃。但后来想想,都走到这一步了,放弃也太窝囊了,于是咬着牙又重来了一轮。
有个小技巧分享给大家:把生成失败的版本也留着。 有时候一个"翻车"的画面,换个角度或者加点滤镜,反而会有意想不到的效果。我在《霓虹剑客》里有一个镜头,原本是生成失败的——剑客的机械手臂多了一根手指。但我把那个画面做了模糊处理,配上音效,反而有一种"机械故障"的赛博朋克感。
第五步:后期剪辑——摆盘上桌

到了收尾这一步了。菜炒好了,得摆盘。
我用的剪辑工具是剪映,因为它对 AI 生成的素材特别友好——自动字幕、智能配乐、一键调色,这些功能能帮你省下大量时间。不过话说回来,剪映也不是没有让人抓狂的时候。我剪辑《霓虹剑客》高潮那段的时候,软件连着卡了三次,每次都是调到一半突然无响应,进度全白费。第三次崩溃的时候我心态差点炸了,差点直接把项目文件删了。后来学乖了,每调完一小段就手动保存一次,再也不敢赌它的稳定性了。
剪辑这一步,我按三个阶段来操作:
阶段一:粗剪。 把所有镜头按分镜表的顺序排列好,删掉明显不能用的素材。这一步不要纠结细节,快速把故事线搭起来。
阶段二:节奏调整。 这是剪辑的灵魂。我会根据配乐的节奏来调整镜头的切换点。武侠片的打斗节奏是"快-慢-快",赛博朋克的节奏是"冷-爆-冷"。把这两种节奏硬刚在一起,就是《霓虹剑客》的剪辑节奏——该燃的时候炸裂全场,该收的时候冷到骨子里。
【提示词模板 11 : AI 配乐生成】
请生成一段 30 秒的背景音乐,用于赛博朋克武侠短剧的高潮打斗场景。风格:古筝和电子合成器的融合, BPM 120-140结构:前 5 秒古筝独奏营造紧张感 → 中间 20 秒电子鼓点加入节奏加快 → 最后 5 秒突然安静只剩一声剑鸣情绪:悲壮、热血、决绝参考:久石让的旋律感 + Hans Zimmer 的史诗感
阶段三:调色和特效。 剪映里有很多现成的滤镜,但我更推荐手动调色。赛博朋克武侠的色调公式是:暗部偏青蓝,亮部偏橙红,中间加一层霓虹粉紫。 这个色调组合,既有赛博朋克的冷峻感,又有武侠片的热血温度。
【提示词模板 12 :剪映调色参数参考】
赛博朋克武侠风格调色参数:- 亮度:-5 到-10 (压暗整体,突出霓虹灯光)- 对比度:+15 到+20 (增强明暗反差)- 饱和度:+10 (让霓虹色更鲜艳)- 色温:-10 (偏冷调)- 色调:+5 (微偏品红)- 高光色调:偏橙(模拟霓虹灯暖光)- 阴影色调:偏青蓝(赛博朋克经典冷色)- 暗角:+20 (聚焦画面中心)- 颗粒感:+10 (增加胶片质感)
音效也是不能忽略的一环。剑刃出鞘的金属声、雨滴落在机械手臂上的声音、霓虹灯牌滋滋的电流声——这些声音加上去之后,整个视频的观感会完全不一样,观众会觉得"真的在那个世界里了",而不只是在看一段画面。
剪映的音效库里有很多可以直接用的素材,搜索"武侠""赛博朋克""科幻"等关键词就能找到。
写在结尾

到这里,一条完整的 AI 短剧就从脚本变成了成片。
回头看看这五步:脚本→分镜→提示词→生成→剪辑。每一步都有模板可以套,每一步都有工具可以帮你。但模板和工具只是拐杖,你对故事的理解和你对美的判断,这些东西是套不了模板的。
经常有人问我 AI 会不会取代创作者,我觉得这个问题本身就问错了。 AI 就是个工具,跟电饭煲一样,它不会让你变成大厨,但至少你不用天天吃泡面了。
《霓虹剑客》这条短剧,从构思到成片,我花了大概两天时间。如果用传统方式,这个量级至少需要一周。省下来的时间去干嘛了呢?说实话也没干什么正经事,主要是在纠结下一个故事讲什么。但至少纠结的时间多了,不是吗?
好了,今天的内容就到这里。这个系列我会持续更新,下一期我们聊聊我的另一部短剧《孤月传》的创作整个过程。
资源时间到!
我把今天文章里提到的所有模板都整理成了一个完整的资源包,包括:
获取方式:关注我,在评论区留言"短剧模板",后台发送资源包下载链接。
如果你觉得这篇文章对你有帮助,欢迎转发给同样在学 AI 视频的朋友。一个人摸索确实容易卡壳,有个能互相看看作品、交流一下踩坑经验,会好很多。
我们下期见。
往期精选
从"生成垃圾图"到"一击即中"AIGC视觉提示词完全入门(上篇)附提示词库
从"用得好"到"用出价值"AIGC视觉提示词进阶完全指南(下篇)附10大高频场景模板
夜雨聆风