第5篇:AI写剧本:用Ollama+DeepSeek生成分镜脚本

第5篇：AI写剧本：用Ollama+DeepSeek生成分镜脚本

实战工作流｜ 2026-06-03 发布

我踩过的坑，你别再踩了

上个月我做第一个漫剧的时候，剧本这一步直接卡了我3天。

不是我不会写剧本，是写出来的东西根本没法用ComfyUI跑。

我一开始以为，让AI写个剧本不就是丢个提示词的事吗？结果AI给我生成了一堆文学化描述："夕阳西下，他望着远方，眼中满是不舍……"

这种东西，ComfyUI能认吗？不能。

ComfyUI要的是分镜脚本——每一帧是什么画面、什么角度、什么情绪，清清楚楚，最好还能直接当成提示词用。

后来我试了各种方案，云API（DeepSeek API、Kimi、GPT-4）都能写，但问题是每次都要花钱，而且有时候还要等速率限制。

直到我把 Ollama + DeepSeek 本地部署之后，才发现：原来本地AI写剧本，不但零成本，质量还不比云端差。

今天这篇，我把整套流程拆给你看。

为什么选Ollama + DeepSeek？

先说结论：本地部署AI写剧本，最佳组合是 Ollama + DeepSeek-R1:14b。

原因有三个：

1. 零成本，无限调用

云端API按Token收费，写一部漫剧的剧本（大概10-15场戏）可能要消耗几万Token。虽然单次不贵，但你如果像我一样，每天测试几十个版本，月底账单会让你怀疑人生。

本地跑，电费而已。

2. 中文理解能力强

DeepSeek-R1 的中文理解，在我实测的几个本地模型里是最好的。写出来的分镜脚本，提示词风格和Civitai上的好评提示词非常接近，不像有些模型写出来的像翻译腔。

3. 可以离线跑

你的ComfyUI工作流、你的素材库，本来就在本地。剧本生成这一步如果在云端，就等于你的创作流程被别人的服务器卡脖子。本地化之后，整个链路都在你自己的机器上，稳。

环境准备：先把Ollama跑起来

如果你还没装Ollama，按这个步骤来（Windows）：

Step1：安装Ollama

官网下载：ollama.com/download

安装完之后，打开命令行（Win+R → cmd），输入：

ollama --version

能看到版本号就说明装好了。

Step2：拉取DeepSeek-R1模型

我推荐两个版本：

模型	显存需求	推荐人群
deepseek-r1:14b	10GB+	有RTX 4080/5080的用户（推荐）
deepseek-r1:7b	6GB+	低配显卡用户

拉取命令（推荐14b）：

ollama pull deepseek-r1:14b

拉取时间取决于网速，我这里大概10分钟。

踩坑提醒：如果你显存不够，模型会强行走CPU推理，速度慢到你想砸电脑。这种情况，先用7b版本，效果差一点但至少能跑。

Step3：验证运行

ollama run deepseek-r1:14b

然后输入一句测试：你好，请介绍一下你自己

能正常回复就说明环境OK了。输入 /bye 退出。

核心技巧：提示词怎么写，AI才懂你要的是"分镜脚本"？

这是最关键的部分。

很多人让AI写剧本，提示词写得太宽泛，AI不知道你要什么格式，就给你写小说。

正确做法是：给模板。

这是我实测有效的提示词模板（直接复制用）：

你是一个专业的AI漫剧分镜脚本撰写师。请根据以下剧情梗概，生成一部12集漫剧的分镜脚本。【剧情梗概】 {{这里填你的故事梗概，50-100字}} 【输出格式要求】每一集包含： 1. 集数编号 2. 本集标题 3. 分镜列表（每个分镜包含：镜头编号、画面描述、人物表情/动作、台词）【分镜画面描述要求】 - 每段画面描述必须可直接作为ComfyUI的提示词使用 - 描述风格参考Civitai好评提示词：具体、视觉化、含光影和构图信息 - 每个分镜的画面描述控制在80-120个英文单词当量【示例格式】第1集：初遇镜头1：全景，校园操场，夕阳，女孩独自坐着，长发被风吹起，侧脸特写，温暖光影提示词：cinematic shot, full body, school uniform girl, sunset, playground, side profile, wind in hair, warm lighting, highly detailed 镜头2：... 现在开始生成。

关键细节：

1. "可直接作为ComfyUI提示词使用" 这句话必须有，AI会朝着这个方向优化输出

2. 给出示例格式，AI看到格式示例之后，输出的结构化程度会高很多

3. 控制每段描述的长度，太长ComfyUI处理慢，太短画面信息不足，80-120英文字符是我实测的甜点区

实战：用Ollama API 接入 ComfyUI 工作流

光让AI写剧本还不够，我们要把这个过程无缝接入ComfyUI工作流。

这里有一个现成方案：ComfyUI-Ollama 自定义节点。

安装 ComfyUI-Ollama 节点

在ComfyUI的自定义节点目录运行：

cd ComfyUI/custom_nodesgit clone https://github.com/stavsap/comfyui-ollama.git

然后重启ComfyUI。

工作流核心节点说明

安装完之后，在你的ComfyUI节点列表里会多出一个 Ollama 分类，核心节点是：

OllamaGenerate 节点

- 输入：model（模型名，如 deepseek-r1:14b）、prompt（提示词）

- 输出：text（生成结果）

- 关键参数：temperature=0.7（控制创造性，剧本建议0.7-0.9）

我的推荐参数：

- temperature: 0.8（剧本需要一定创造性，但也不能太飘）

- max_tokens: 4096（分镜脚本比较长，设大一点）

- top_p: 0.9

质量提升技巧：让AI写出"能用的"分镜脚本

用了上面那个模板之后，你会发现AI写的东西已经不错了，但还有提升空间。

技巧1：分两步生成，不要一步到位

不要试图让AI一次性生成整部漫剧的完整分镜脚本，质量会下降。

正确做法：

Step 1：让AI生成"剧情大纲"（梗概 + 分集标题 + 每集核心冲突） Step 2：拿大纲，逐集让AI生成"分镜脚本"

分步之后，每集的分镜质量明显更高，因为AI的注意力更集中。

技巧2：给参考风格

如果你有喜欢的漫剧风格，在提示词里加上：

参考以下作品的分镜风格： - 光影风格：{{参考作品名}} - 构图特点：{{具体描述}}

我自己测试时参考的是新海诚的风格，AI会在画面描述里主动加入"soft lighting"、"blue sky"这类关键词，出来的图风格很统一。

技巧3：人工审核 + 快速迭代

AI生成的分镜脚本，一定要人工过一遍。

主要检查两件事：

1. 提示词里有没有和你的Checkpoint模型冲突的风格词

2. 分镜的连贯性（相邻镜头的画面描述有没有突变）

发现问题，直接把修正意见丢回给Ollama，让它重新生成那一集。因为是本地模型，重新生成不需要额外成本。

常见坑点提醒

坑1：显存溢出导致Ollama崩溃

DeepSeek-R1:14b 在推理时大概占用10-12GB显存。如果你同时还在跑ComfyUI出图，显存可能不够用。

解决方案：在Ollama运行剧本生成时，暂停ComfyUI出图任务；或者把 num_gpu 参数调低（让部分层走CPU）。

坑2：生成的内容突然变成英文

DeepSeek-R1 在 temperature 设太高的时候，偶尔会混用英文输出。

解决方案：temperature 不要超过 0.9；在提示词开头明确写"请用中文回答"。

坑3：分镜提示词太长，ComfyUI出图效果反而差

提示词不是越长越好。超过120个token之后，Stable Diffusion的注意力会被稀释，画面反而乱。

解决方案：每个分镜的画面描述，控制在80-120个英文单词当量。如果AI生成得太长，在提示词里加一句"每个分镜的画面描述不超过100个英文单词"。

文末福利

这套「剧本→分镜」的ComfyUI工作流，我已经整理成JSON文件了。

领取方式：关注公众号「AI漫剧实验室」，后台回复关键词 【ai剧本】，自动获取：

- 剧本→分镜完整工作流 JSON（可直接导入ComfyUI）

- 分镜提示词模板 Excel 表（可直接复制）

- DeepSeek-R1 提示词最佳实践文档（PDF）

永久有效，随时可领。

📌 还没加群？

公众号回复「漫剧群」

加入【AI漫剧实验室 · 本地实战群】200+工作流创作者，等你来聊。

下篇预告：第6篇《角色一致性终极方案：LoRA vs IP-Adapter vs PuLID》——三种方案我会全部实测一遍，告诉你哪个值得投入时间。