Agnes AI + ArcReel + O4OpenAI:我搭了一套零成本的 AI 视频生成流水线
最近在折腾一个事:能不能不花一分钱,把一段文字变成一支像样的短视频?
试了一圈下来,还真让我拼出来了。核心就三个东西——Agnes AI 提供免费 API,O4OpenAI 做协议转换,ArcReel 当创作工作台。三个项目串起来,从写剧本到出视频,一条龙。
下面聊聊我是怎么搭的,以及踩了哪些坑。
先说 Agnes AI:白嫖党狂喜

Agnes AI(agnes-ai.com)是 Sapiens AI 做的一个 AI 网关平台,简单说就是给你免费发 API Key,让你调他们的模型。对,免费。
它底下有三个产品线:
Agnes:主打对话和推理,支持 Thinking 模式和 Function Calling,写剧本、做角色分析够用 Echo:图像生成,文生图、图生图都行,模型叫 agnes-image-2.1-flash Pavo:视频生成,文生视频、图生视频、首尾帧生视频,模型叫 agnes-video-v2.0
注册就送额度,日常玩玩根本用不完。而且它的 API 格式跟 OpenAI 不完全一样,有些地方有自己的一套,这就给后面埋了个坑——ArcReel 默认不认它的接口。
不过别急,O4OpenAI 就是来填这个坑的。
ArcReel:小说直接变视频,认真的

ArcReel 是我在 GitHub 上刷到的一个开源项目,2.5k star,做的是一件事:把小说变成短视频。
听起来很玄,但它确实跑通了整个流程:
你丢一段小说文本进去 它自动提取角色、线索、场景 按集规划,生成剧本 JSON 给每个角色出设计图(保证跨镜头一致性) 生成分镜图 / 宫格图 每个分镜生成视频片段 最后 FFmpeg 合成完整视频,还能导出剪映草稿
整个流程是 AI Agent 驱动的,基于 Claude Agent SDK,编排 Skill + 聚焦 Subagent 的多智能体架构。说人话就是:一个大 Agent 负责调度,一堆小 Agent 各干各的活,干完汇报。
它支持的供应商也多:Gemini、火山方舟、Grok、OpenAI、Vidu,还能加自定义供应商。自定义供应商这四个字是关键——后面要靠它接入 Agnes AI。
O4OpenAI:那个"翻译官"

O4OpenAI 是整个链路的中间件,干的事很简单:把 Agnes AI 的 API 翻译成 OpenAI 兼容格式。
为什么要翻译?因为 ArcReel 的自定义供应商走的是 OpenAI 兼容协议,而 Agnes AI 的接口虽然跟 OpenAI 类似,但有些字段和路径不一样。直接接,接不上。
O4OpenAI 对外同时提供两套接口:
OpenAI 兼容: /v1/chat/completions、/v1/images/generations、/v1/videos这些标准路径Anthropic 兼容: /v1/messages,兼容 Anthropic SDK
内部调 Agnes AI 的 API,外部给客户端一个标准 OpenAI 的体验。关键特性:
流式传输支持(SSE) 模型映射——可以把 gpt-4o映射到 Agnes 的模型名Thinking 模式透传 Function Calling / Tool Use 完整支持 图生图、首尾帧视频也走 OpenAI 风格封装 Multipart 表单支持,兼容 OpenAI Python SDK
说白了,ArcReel 以为自己在调 OpenAI,实际上背后是 Agnes AI 在干活。
串起来:三件套怎么联动
画个简单的架构图就清楚了:
Agnes AI(模型服务) ↓ API 调用O4OpenAI(协议转换网关,localhost:1241) ↓ OpenAI 兼容接口ArcReel(视频生成工作台)打个比方:Agnes AI 是发电厂,O4OpenAI 是变压器,ArcReel 是你家里的电器。电厂的电不能直接插电器上,得变个压。
具体操作步骤
第一步:拿 Agnes AI 的 Key
去 agnes-ai.com 注册,进控制台生成 API Key。免费的,不用绑卡。
第二步:部署 O4OpenAI
git clone https://github.com/javpower/O4OpenAI.gitcd O4OpenAI# 按项目 README 配置 .env,填入 Agnes AI 的 Key# 启动服务,默认跑在 1241 端口启动之后,O4OpenAI 就在本地监听 http://localhost:1241,对外暴露标准 OpenAI 接口。
验证一下能不能通:
curl http://localhost:1241/v1/models \ -H "Authorization: Bearer YOUR_AGNES_API_KEY"能返回模型列表就说明没问题。
第三步:部署 ArcReel
git clone https://github.com/ArcReel/ArcReel.gitcd ArcReel/deploycp .env.example .envdocker compose up -d访问 http://localhost:1241(ArcReel 默认也是 1241,注意改端口别冲突),用默认账号 admin 登录。
第四步:在 ArcReel 里配置自定义供应商
进 ArcReel 的设置页,添加自定义供应商:
Base URL: http://localhost:1241/v1(指向 O4OpenAI)API Key:你的 Agnes AI Key 供应商类型:OpenAI 兼容
ArcReel 会自动调 /v1/models 发现可用模型,按名称推断是图像模型还是视频模型。
第五步:开干
新建项目,丢一段小说文本进去,选你刚配的自定义供应商,剩下的交给 Agent 跑就行。它会自动走完:角色提取 → 剧本生成 → 角色设计图 → 分镜图 → 视频片段 → 合成。
几个实际用下来的感受
关于 Agnes AI 的图像质量:agnes-image-2.1-flash 出图速度很快,质量中上。角色设计图这种需要一致性的场景,建议多生成几次挑最稳定的。图生图能力不错,改背景、换风格这种操作比较稳。
关于视频生成:agnes-video-v2.0 是异步的,提交任务后需要轮询状态。O4OpenAI 帮你封装好了 /v1/videos/:id 查状态、/v1/videos/:id/content 下载,ArcReel 这边自动处理,不用手动轮询。
关于一致性:ArcReel 的角色设计图机制确实能保证跨镜头的角色一致性,这是它比手动一个个生图强的地方。线索追踪也能让道具和场景在多个镜头里保持连贯。
关于成本:Agnes AI 免费额度够日常玩,O4OpenAI 和 ArcReel 都是开源免费的,唯一成本就是跑服务的机器。Docker 部署的话,一台普通云服务器就行。
API 能力对照表
POST /v1/chat/completions | ||
POST /v1/images/generations | ||
POST /v1/images/edits | ||
POST /v1/videos | ||
POST /v1/videos | ||
POST /v1/videos |
适合什么人玩
网文作者:把自己的小说片段变成短视频发抖音/B站,零门槛 独立开发者:快速做产品 demo 视频,不用找设计师 内容创作者:批量生产短视频内容,效率拉满 AI 爱好者:折腾多 Agent 协作、API 网关这些技术点,学习价值很高
相关链接
Agnes AI 官网:https://agnes-ai.com/ ArcReel GitHub:https://github.com/ArcReel/ArcReel O4OpenAI GitHub:https://github.com/javpower/O4OpenAI
三个项目都是活跃维护的,遇到问题可以去各自的社区问。ArcReel 有飞书交流群,O4OpenAI 的 Issue 响应也挺快。
搭这套东西前后大概花了两个小时,大部分时间在改配置。跑通之后,丢一段千字小说进去,等个十几分钟就能出视频,虽然离专业级还有距离,但作为零成本方案,已经相当能打了。
有兴趣的可以试试,有问题评论区聊。
夜雨聆风