从文案到配图到发布,搭建你的 AI 内容自动化流水线

写在前面
做内容创作的你,是否经历过这样的场景:
深夜赶稿,好不容易写完一篇深度文章,却发现没有合适的配图。打开 Midjourney,Gemini发现需要构思提示词,生成,下载太繁琐;使用Nano Banana ,通义万相API 调用费让人肉疼...
今天分享一个完全免费的解决方案——利用 Google Gemini 的 Nano Banana 生图能力,配合 OpenClaw 自动化框架,实现从文案创作到配图生成再到社交发布的全流程自动化。
更重要的是:零代码基础也能上手。
一、为什么是 Gemini Nano Banana?
1. 真正的零成本
| Gemini 免费版 | 完全免费 | 每天 20 张 |
对于绝大多数创作者来说,免费版每天 20 张完全够用。即使是重度用户,去海鲜市场拼一个 Pro 家庭组年卡,也就几十块钱,平均每天不到 2 毛钱。
2. 生图质量惊艳
Google 的 Nano Banana 生图模型有几个显著优势:
• 文字渲染能力强:生成的图片中文字清晰可辨,不像某些模型全是乱码 • 细节丰富:光影、材质、构图都有专业水准 • 风格多样:从 3D 渲染到插画手绘,从写实照片到概念艺术,一键切换 • 理解准确:对复杂 Prompt 的理解到位,少出现"画虎不成反类犬"的情况

上图:使用 Nano Banana 生成的动画科普图,沟图和细节表现都非常出色
3. 无需API的调用方式
通过 baoyu-danger-gemini-web 这个 Skill,我们可以在本地命令行直接调用 Gemini 的生图能力,无需搭建代理,无需编写复杂代码。
二、核心工具:baoyu-danger-gemini-web
这是整个自动化流程的核心组件。简单来说,它是一个伪 API 客户端——通过逆向工程模拟浏览器行为,让我们可以用命令行的方式调用 Gemini Web 版的生图功能。
安装与配置
# 前提:已安装 OpenClaw 和 bun# Skill 已内置在 OpenClaw 生态中,无需额外安装# 首次使用需要登录 Google 账号获取 CookieGEMINI_WEB_LOGIN=1 bun scripts/main.ts --prompt "test" --image test.png系统会自动打开浏览器,你只需正常登录 Google 账号并访问 Gemini 页面,Cookie 就会被自动缓存,后续调用无需重复登录。
基础用法
# 单张图片生成bun scripts/main.ts \ --prompt "A futuristic robot writing code, neon blue lighting, 3D render style" \ --image output.png \ --model gemini-3-flash# 多轮对话(保持上下文)bun scripts/main.ts \ --prompt "Make it more cyberpunk" \ --image output2.png \ --sessionId my-session支持的模型
gemini-3-flash | ||
gemini-3-pro | ||
gemini-3-flash-thinking |
三、实战:搭建自动化工作流
现在来到最精彩的部分——如何让整个流程自动化运行。
场景
我有一个 Agent 叫 Chinglish Scholar,专门负责撰写中式英文科普。完整实现:
Chinglish Scholar 写完文章 → 自动提取关键内容生成配图 → 自动发布到 X 平台
工作流架构
┌─────────────────┐ ┌─────────────────┐ ┌─────────────────┐│ Chinglish │ │ 小彩 (xiaocai) │ │ X 平台 ││ Scholar │────▶│ 生图 Agent │────▶│ 发布 ││ (文案创作) │ │ (配图生成) │ │ (自动推文) │└─────────────────┘ └─────────────────┘ └─────────────────┘ │ │ │ └───────────────────────┴───────────────────────┘ OpenClaw 调度实现步骤
步骤 1:文案创作 Agent 完成写作
Chinglish Scholar 完成文章后,将内容写入指定目录,并触发后续流程。
步骤 2:自动提取配图需求
通过 OpenClaw 的会话机制,Chinglish Scholar 可以发送消息给小彩:
小彩,请为这篇文章生成配图:- 主题:AI 自动化的未来- 风格:科技蓝、3D 渲染- 尺寸:1200x675(X 平台卡片尺寸)步骤 3:小彩调用 Gemini 生图
小彩收到任务后,自动执行:
GEMINI_WEB_LOGIN=1 bun scripts/main.ts \ --prompt "AI automation concept, futuristic workflow visualization, neon blue and white color scheme, 3D render, clean background" \ --image /Users/pengjianfang/.openclaw/image/x-post-$(date +%Y%m%d).png \ --model gemini-3-flash步骤 4:自动发布到 X
配图生成完成后,结合文案内容,通过 X API 或浏览器自动化工具完成发布。
四、进阶技巧
1. 批量生成封面图
如果你运营多个账号,可以写一个批量脚本:
#!/bin/bash# batch-generate.shTOPICS=("AI trends" "Tech review" "Coding tips" "Productivity")for topic in "${TOPICS[@]}"; do bun scripts/main.ts \ --prompt "Cover image for $topic, minimalist design, tech style" \ --image "cover-${topic// /-}.png" \ --model gemini-3-flash & sleep 300 # 等待生成完成done2. 风格一致性保持
使用 --sessionId 参数保持多轮对话,确保系列图片风格统一:
# 第一张bun scripts/main.ts --prompt "Tech blog cover, blue theme" --image cover1.png --sessionId blog-series# 第二张(继承风格)bun scripts/main.ts --prompt "Same style, topic: AI tools" --image cover2.png --sessionId blog-series3. 参考图模式
上传参考图,让 Gemini 在保持风格的基础上进行变化:
bun scripts/main.ts \ --prompt "Create variation with different color scheme" \ --reference original.png \ --image variation.png五、常见问题与解决方案
Q1: 提示 Cookie 过期怎么办?
# 添加环境变量强制刷新 CookieGEMINI_WEB_LOGIN=1 bun scripts/main.ts ...确保 Chrome 浏览器已登录 Google 账号并打开了 Gemini 页面。
Q2: 生成速度太慢?
• 使用 --model gemini-3-flash代替 Pro 模型• 后台运行 + sleep等待,避免阻塞其他任务
Q3: 图片分辨率不够?
Gemini 标准输出为 1408x768,如需更高分辨率,可以:
• 使用 Upscayl 等 AI 放大工具二次处理 • 或考虑 Doubao Image Gen(支持 2730x1535)作为备选
六、写在最后
AI 工具的价值不仅在于"能用",更在于能否融入你的工作流。
Google Gemini 的 Nano Banana 生图能力 + OpenClaw 的自动化框架,让我们可以用零成本搭建起一套专业级的 AI 内容生产流水线。
从 Chinglish Scholar 的文案创作,到小彩的自动配图,再到 X 平台的定时发布——整个过程无需人工干预。
这就是自动化的魅力:设定一次,持续产出。
资源汇总
baoyu-cover-image |
关注私信回复「Gemini」,免费领取skill 👇
如果你也搭建了自己的 AI 自动化工作流,欢迎在评论区分享你的经验!
P.S. 本文封面图由小彩使用 baoyu-cover-image Skill 自动生成 🎨
夜雨聆风