Agnes AI + ArcReel + O4OpenAI:我搭了一套零成本的 AI 视频生成流水线

Agnes AI + ArcReel + O4OpenAI：我搭了一套零成本的 AI 视频生成流水线

最近在折腾一个事：能不能不花一分钱，把一段文字变成一支像样的短视频？

试了一圈下来，还真让我拼出来了。核心就三个东西——Agnes AI 提供免费 API，O4OpenAI 做协议转换，ArcReel 当创作工作台。三个项目串起来，从写剧本到出视频，一条龙。

下面聊聊我是怎么搭的，以及踩了哪些坑。

先说 Agnes AI：白嫖党狂喜

Agnes AI（agnes-ai.com）是 Sapiens AI 做的一个 AI 网关平台，简单说就是给你免费发 API Key，让你调他们的模型。对，免费。

它底下有三个产品线：

Agnes：主打对话和推理，支持 Thinking 模式和 Function Calling，写剧本、做角色分析够用
Echo：图像生成，文生图、图生图都行，模型叫 agnes-image-2.1-flash
Pavo：视频生成，文生视频、图生视频、首尾帧生视频，模型叫 agnes-video-v2.0

注册就送额度，日常玩玩根本用不完。而且它的 API 格式跟 OpenAI 不完全一样，有些地方有自己的一套，这就给后面埋了个坑——ArcReel 默认不认它的接口。

不过别急，O4OpenAI 就是来填这个坑的。

ArcReel：小说直接变视频，认真的

ArcReel 是我在 GitHub 上刷到的一个开源项目，2.5k star，做的是一件事：把小说变成短视频。

听起来很玄，但它确实跑通了整个流程：

你丢一段小说文本进去
它自动提取角色、线索、场景
按集规划，生成剧本 JSON
给每个角色出设计图（保证跨镜头一致性）
生成分镜图 / 宫格图
每个分镜生成视频片段
最后 FFmpeg 合成完整视频，还能导出剪映草稿

整个流程是 AI Agent 驱动的，基于 Claude Agent SDK，编排 Skill + 聚焦 Subagent 的多智能体架构。说人话就是：一个大 Agent 负责调度，一堆小 Agent 各干各的活，干完汇报。

它支持的供应商也多：Gemini、火山方舟、Grok、OpenAI、Vidu，还能加自定义供应商。自定义供应商这四个字是关键——后面要靠它接入 Agnes AI。

O4OpenAI：那个"翻译官"

O4OpenAI 是整个链路的中间件，干的事很简单：把 Agnes AI 的 API 翻译成 OpenAI 兼容格式。

为什么要翻译？因为 ArcReel 的自定义供应商走的是 OpenAI 兼容协议，而 Agnes AI 的接口虽然跟 OpenAI 类似，但有些字段和路径不一样。直接接，接不上。

O4OpenAI 对外同时提供两套接口：

OpenAI 兼容：/v1/chat/completions、/v1/images/generations、/v1/videos 这些标准路径
Anthropic 兼容：/v1/messages，兼容 Anthropic SDK

内部调 Agnes AI 的 API，外部给客户端一个标准 OpenAI 的体验。关键特性：

流式传输支持（SSE）
模型映射——可以把 gpt-4o 映射到 Agnes 的模型名
Thinking 模式透传
Function Calling / Tool Use 完整支持
图生图、首尾帧视频也走 OpenAI 风格封装
Multipart 表单支持，兼容 OpenAI Python SDK

说白了，ArcReel 以为自己在调 OpenAI，实际上背后是 Agnes AI 在干活。

串起来：三件套怎么联动

画个简单的架构图就清楚了：

Agnes AI（模型服务）    ↓ API 调用O4OpenAI（协议转换网关，localhost:1241）    ↓ OpenAI 兼容接口ArcReel（视频生成工作台）

打个比方：Agnes AI 是发电厂，O4OpenAI 是变压器，ArcReel 是你家里的电器。电厂的电不能直接插电器上，得变个压。

具体操作步骤

第一步：拿 Agnes AI 的 Key

去 agnes-ai.com 注册，进控制台生成 API Key。免费的，不用绑卡。

第二步：部署 O4OpenAI

git clone https://github.com/javpower/O4OpenAI.gitcd O4OpenAI# 按项目 README 配置 .env，填入 Agnes AI 的 Key# 启动服务，默认跑在 1241 端口

启动之后，O4OpenAI 就在本地监听 http://localhost:1241，对外暴露标准 OpenAI 接口。

验证一下能不能通：

curl http://localhost:1241/v1/models \  -H "Authorization: Bearer YOUR_AGNES_API_KEY"

能返回模型列表就说明没问题。

第三步：部署 ArcReel

git clone https://github.com/ArcReel/ArcReel.gitcd ArcReel/deploycp .env.example .envdocker compose up -d

访问 http://localhost:1241（ArcReel 默认也是 1241，注意改端口别冲突），用默认账号 admin 登录。

第四步：在 ArcReel 里配置自定义供应商

进 ArcReel 的设置页，添加自定义供应商：

Base URL：http://localhost:1241/v1（指向 O4OpenAI）
API Key：你的 Agnes AI Key
供应商类型：OpenAI 兼容

ArcReel 会自动调 /v1/models 发现可用模型，按名称推断是图像模型还是视频模型。

第五步：开干

新建项目，丢一段小说文本进去，选你刚配的自定义供应商，剩下的交给 Agent 跑就行。它会自动走完：角色提取 → 剧本生成 → 角色设计图 → 分镜图 → 视频片段 → 合成。

几个实际用下来的感受

关于 Agnes AI 的图像质量：agnes-image-2.1-flash 出图速度很快，质量中上。角色设计图这种需要一致性的场景，建议多生成几次挑最稳定的。图生图能力不错，改背景、换风格这种操作比较稳。

关于视频生成：agnes-video-v2.0 是异步的，提交任务后需要轮询状态。O4OpenAI 帮你封装好了 /v1/videos/:id 查状态、/v1/videos/:id/content 下载，ArcReel 这边自动处理，不用手动轮询。

关于一致性：ArcReel 的角色设计图机制确实能保证跨镜头的角色一致性，这是它比手动一个个生图强的地方。线索追踪也能让道具和场景在多个镜头里保持连贯。

关于成本：Agnes AI 免费额度够日常玩，O4OpenAI 和 ArcReel 都是开源免费的，唯一成本就是跑服务的机器。Docker 部署的话，一台普通云服务器就行。

API 能力对照表

能力	O4OpenAI 暴露的接口	ArcReel 里的用途
对话/推理	`POST /v1/chat/completions`	剧本创作、角色提取、结构化输出
文生图	`POST /v1/images/generations`	角色设计图、场景概念图
图生图	`POST /v1/images/edits`	风格迁移、角色变体
文生视频	`POST /v1/videos`	分镜转视频片段
图生视频	`POST /v1/videos` （带 image input）	分镜图动画化
首尾帧视频	`POST /v1/videos` （带 first_frame + last_frame）	镜头过渡动画

适合什么人玩

网文作者：把自己的小说片段变成短视频发抖音/B站，零门槛
独立开发者：快速做产品 demo 视频，不用找设计师
内容创作者：批量生产短视频内容，效率拉满
AI 爱好者：折腾多 Agent 协作、API 网关这些技术点，学习价值很高