第5篇:AI写剧本:用Ollama+DeepSeek生成分镜脚本
实战工作流 | 2026-06-03 发布
我踩过的坑,你别再踩了
上个月我做第一个漫剧的时候,剧本这一步直接卡了我3天。
不是我不会写剧本,是写出来的东西根本没法用ComfyUI跑。
我一开始以为,让AI写个剧本不就是丢个提示词的事吗?结果AI给我生成了一堆文学化描述:"夕阳西下,他望着远方,眼中满是不舍……"
这种东西,ComfyUI能认吗?不能。
ComfyUI要的是分镜脚本——每一帧是什么画面、什么角度、什么情绪,清清楚楚,最好还能直接当成提示词用。
后来我试了各种方案,云API(DeepSeek API、Kimi、GPT-4)都能写,但问题是每次都要花钱,而且有时候还要等速率限制。
直到我把 Ollama + DeepSeek 本地部署之后,才发现:原来本地AI写剧本,不但零成本,质量还不比云端差。
今天这篇,我把整套流程拆给你看。
为什么选Ollama + DeepSeek?
先说结论:本地部署AI写剧本,最佳组合是 Ollama + DeepSeek-R1:14b。
原因有三个:
1. 零成本,无限调用
云端API按Token收费,写一部漫剧的剧本(大概10-15场戏)可能要消耗几万Token。虽然单次不贵,但你如果像我一样,每天测试几十个版本,月底账单会让你怀疑人生。
本地跑,电费而已。
2. 中文理解能力强
DeepSeek-R1 的中文理解,在我实测的几个本地模型里是最好的。写出来的分镜脚本,提示词风格和Civitai上的好评提示词非常接近,不像有些模型写出来的像翻译腔。
3. 可以离线跑
你的ComfyUI工作流、你的素材库,本来就在本地。剧本生成这一步如果在云端,就等于你的创作流程被别人的服务器卡脖子。本地化之后,整个链路都在你自己的机器上,稳。
环境准备:先把Ollama跑起来
如果你还没装Ollama,按这个步骤来(Windows):
Step1:安装Ollama
官网下载:ollama.com/download
安装完之后,打开命令行(Win+R → cmd),输入:
ollama --version
能看到版本号就说明装好了。
Step2:拉取DeepSeek-R1模型
我推荐两个版本:
拉取命令(推荐14b):
ollama pull deepseek-r1:14b
拉取时间取决于网速,我这里大概10分钟。
踩坑提醒:如果你显存不够,模型会强行走CPU推理,速度慢到你想砸电脑。这种情况,先用7b版本,效果差一点但至少能跑。
Step3:验证运行
ollama run deepseek-r1:14b
然后输入一句测试:你好,请介绍一下你自己
能正常回复就说明环境OK了。输入 /bye 退出。
核心技巧:提示词怎么写,AI才懂你要的是"分镜脚本"?
这是最关键的部分。
很多人让AI写剧本,提示词写得太宽泛,AI不知道你要什么格式,就给你写小说。
正确做法是:给模板。
这是我实测有效的提示词模板(直接复制用):
你是一个专业的AI漫剧分镜脚本撰写师。 请根据以下剧情梗概,生成一部12集漫剧的分镜脚本。 【剧情梗概】 {{这里填你的故事梗概,50-100字}} 【输出格式要求】 每一集包含: 1. 集数编号 2. 本集标题 3. 分镜列表(每个分镜包含:镜头编号、画面描述、人物表情/动作、台词) 【分镜画面描述要求】 - 每段画面描述必须可直接作为ComfyUI的提示词使用 - 描述风格参考Civitai好评提示词:具体、视觉化、含光影和构图信息 - 每个分镜的画面描述控制在80-120个英文单词当量 【示例格式】 第1集:初遇 镜头1:全景,校园操场,夕阳,女孩独自坐着,长发被风吹起,侧脸特写,温暖光影 提示词:cinematic shot, full body, school uniform girl, sunset, playground, side profile, wind in hair, warm lighting, highly detailed 镜头2:... 现在开始生成。
关键细节:
1. "可直接作为ComfyUI提示词使用" 这句话必须有,AI会朝着这个方向优化输出
2. 给出示例格式,AI看到格式示例之后,输出的结构化程度会高很多
3. 控制每段描述的长度,太长ComfyUI处理慢,太短画面信息不足,80-120英文字符是我实测的甜点区
实战:用Ollama API 接入 ComfyUI 工作流
光让AI写剧本还不够,我们要把这个过程无缝接入ComfyUI工作流。
这里有一个现成方案:ComfyUI-Ollama 自定义节点。
安装 ComfyUI-Ollama 节点
在ComfyUI的自定义节点目录运行:
cd ComfyUI/custom_nodesgit clone https://github.com/stavsap/comfyui-ollama.git
然后重启ComfyUI。
工作流核心节点说明
安装完之后,在你的ComfyUI节点列表里会多出一个 Ollama 分类,核心节点是:
OllamaGenerate 节点
- 输入:model(模型名,如 deepseek-r1:14b)、prompt(提示词)
- 输出:text(生成结果)
- 关键参数:temperature=0.7(控制创造性,剧本建议0.7-0.9)
我的推荐参数:
- temperature: 0.8(剧本需要一定创造性,但也不能太飘)
- max_tokens: 4096(分镜脚本比较长,设大一点)
- top_p: 0.9
质量提升技巧:让AI写出"能用的"分镜脚本
用了上面那个模板之后,你会发现AI写的东西已经不错了,但还有提升空间。
技巧1:分两步生成,不要一步到位
不要试图让AI一次性生成整部漫剧的完整分镜脚本,质量会下降。
正确做法:
Step 1:让AI生成"剧情大纲"(梗概 + 分集标题 + 每集核心冲突) Step 2:拿大纲,逐集让AI生成"分镜脚本"
分步之后,每集的分镜质量明显更高,因为AI的注意力更集中。
技巧2:给参考风格
如果你有喜欢的漫剧风格,在提示词里加上:
参考以下作品的分镜风格: - 光影风格:{{参考作品名}} - 构图特点:{{具体描述}}
我自己测试时参考的是新海诚的风格,AI会在画面描述里主动加入"soft lighting"、"blue sky"这类关键词,出来的图风格很统一。
技巧3:人工审核 + 快速迭代
AI生成的分镜脚本,一定要人工过一遍。
主要检查两件事:
1. 提示词里有没有和你的Checkpoint模型冲突的风格词
2. 分镜的连贯性(相邻镜头的画面描述有没有突变)
发现问题,直接把修正意见丢回给Ollama,让它重新生成那一集。因为是本地模型,重新生成不需要额外成本。
常见坑点提醒
坑1:显存溢出导致Ollama崩溃
DeepSeek-R1:14b 在推理时大概占用10-12GB显存。如果你同时还在跑ComfyUI出图,显存可能不够用。
解决方案:在Ollama运行剧本生成时,暂停ComfyUI出图任务;或者把 num_gpu 参数调低(让部分层走CPU)。
坑2:生成的内容突然变成英文
DeepSeek-R1 在 temperature 设太高的时候,偶尔会混用英文输出。
解决方案:temperature 不要超过 0.9;在提示词开头明确写"请用中文回答"。
坑3:分镜提示词太长,ComfyUI出图效果反而差
提示词不是越长越好。超过120个token之后,Stable Diffusion的注意力会被稀释,画面反而乱。
解决方案:每个分镜的画面描述,控制在80-120个英文单词当量。如果AI生成得太长,在提示词里加一句"每个分镜的画面描述不超过100个英文单词"。
文末福利
这套「剧本→分镜」的ComfyUI工作流,我已经整理成JSON文件了。
领取方式:关注公众号「AI漫剧实验室」,后台回复关键词 【ai剧本】,自动获取:
- 剧本→分镜完整工作流 JSON(可直接导入ComfyUI)
- 分镜提示词模板 Excel 表(可直接复制)
- DeepSeek-R1 提示词最佳实践文档(PDF)
永久有效,随时可领。
📌 还没加群?
公众号回复「漫剧群」
加入【AI漫剧实验室 · 本地实战群】200+工作流创作者,等你来聊。
下篇预告:第6篇《角色一致性终极方案:LoRA vs IP-Adapter vs PuLID》——三种方案我会全部实测一遍,告诉你哪个值得投入时间。
夜雨聆风