如何让小龙虾(OpenClaw)具备生图生视频能力?

OpenClaw：小龙虾AI，一个让AI真正能"干活"的工具

你有没有这种感觉？

AI刚出来的时候，觉得它啥都能干。结果一用，发现它只会聊天，画个图？不好意思，你得去Midjourney。拍个视频？去Runway吧。写个代码？行，但生成图片还是得复制粘贴到别的工具。

这就是传说中的"工具孤岛"问题——每个AI都有自己的擅长，但就是不能串起来用。

今天要聊的，是一个叫 OpenClaw 的开源AI Agent框架，中文名叫"小龙虾"。它解决的核心问题就是： 让你的AI不仅能聊天，还能直接生图、生视频，而且全部在一个对话里搞定。

——————————————

01 小龙虾是谁？凭什么这么火？

先给不了解的朋友科普一下。

OpenClaw是2025年底出来的一个开源AI工具，上线几个月GitHub星标就突破了34万。这什么概念？比很多老牌开源项目都猛。

它的核心理念很有意思： "The AI that actually does things" ——翻译成人话就是：这个AI是真的能干活，不是只会耍嘴皮子。

传统的AI助手，你问它问题，它给你回答。
小龙虾不一样。你让它帮你写一份报告，它真的能：
- 打开电脑找到文件
- 分析内容
- 联网查资料
- 生成配图
- 发邮件给你

全程自动，你只需要说一句话。

这才是我想要的AI好吗！

——————————————

02 为什么要给它加生图生视频能力？

好，问题来了——小龙虾默认没有生图生视频能力吗？

答：默认情况下，它真的没有。

这不怪它。AI Agent的核心是"执行任务"，默认专注于文字处理和工具调用。图像和视频生成属于另一个领域，需要专门的模型和API。

但是！

通过插件系统，小龙虾可以轻松获得这些能力。而且一旦装上，你就可以在对话里直接说"帮我画一张图"或者"生成一段视频"，Agent自动帮你搞定一切。

想象一下这个场景：
- 你让Agent写一篇产品介绍
- 它自动生成了文案
- 同时生成了配套的产品图
- 还生成了一段展示视频
- 全程你只动了一张嘴

这不比那些"人工智障"强多了？

——————————————

03 三种方法让你的小龙虾会画画

根据我的实测，给小龙虾增加生图能力有三条路：

方法一：内置MiniMax图像生成（推荐小白）

这是2026年3月底3.28版本更新的重磅功能。

优点：
- 开箱即用，配置超简单
- 画质不错，速度快
- 支持文生图和图生图

缺点：
- 需要MiniMax的API Key
- 国内用户申请稍微麻烦点

配置步骤：

第一步：去MiniMax开放平台申请API Key

访问：platform.minimaxi.com
注册账号 → 创建应用 → 获取API Key

第二步：配置环境变量

exportMINIMAX_API_KEY="你的密钥"

第三步：在配置文件中设置图像生成模型

{
"agents":{
"defaults":{
"imageGenerationModel":{
"primary":"minimax/image-01"
}
}
}
}

第四步：直接开画！

你：帮我画一只穿着西装的猫，在纽约时代广场
Agent：🎨 正在生成...（几秒后）图片出来了

支持的比例：1:1、16:9、4:3、3:2、2:3、3:4、9:16、21:9
一次最多生成9张图，够你挑了吧？

——————————————

方法二：Google Gemini图像生成（适合有梯子的）

如果你已经有Google AI的使用习惯，用Gemini也是个好选择。

优点：
- 画质极其出色
- 支持4K超清输出
- 有免费额度

配置步骤：

第一步：获取Gemini API Key

访问：ai.google.dev
登录 → 创建API Key

第二步：设置环境变量

exportGEMINI_API_KEY="你的密钥"

第三步：配置文件

{
"agents":{
"defaults":{
"imageGenerationModel":"google/gemini-3-pro-image-preview"
}
}
}

第四步：开画！

你：生成一张赛博朋克风格的东京夜景
Agent：✨ 正在生成高清图像...

——————————————

方法三：OpenAI DALL-E（适合已经用OpenAI的）

如果你已经在用GPT，配个DALL-E是最顺滑的选择。

配置：

{
"skills":{
"imageGen":{
"provider":"openai",
"model":"dall-e-3",
"apiKey":"${OPENAI_API_KEY}",
"defaultSize":"1024x1024",
"defaultQuality":"standard"
}
}
}

——————————————

04 视频生成：让你的AI成为导演

说完生图，再来说说更刺激的—— 生视频 。

2026年4月，OpenClaw正式支持视频生成，接入了 12家 主流视频生成提供商。这阵容，比很多专业视频工具都猛：

提供商	默认模型	文生视频	图生视频	API密钥
OpenAI	Sora 2	✅	✅	OPENAI_API_KEY
Google	Veo 3.1	✅	✅	GEMINI_API_KEY
MiniMax	Hailuo 2.3	✅	✅	MINIMAX_API_KEY
Alibaba	Wan 2.6	✅	✅	MODELSTUDIO_API_KEY
Runway	Gen 4.5	✅	✅	RUNWAYML_API_SECRET
BytePlus	Seedance	✅	✅	BYTEPLUS_API_KEY
Qwen	Wan 2.6	✅	✅	QWEN_API_KEY
xAI	Grok-Video	✅	✅	XAI_API_KEY
fal	MiniMax-Video	✅	✅	FAL_KEY
Together	Wan 2.2	✅	❌	TOGETHER_API_KEY
ComfyUI	Workflow	✅	✅	COMFY_API_KEY
Vydra	Veo 3	✅	✅	VYDRA_API_KEY

配置视频生成

最简单的配置——直接设置环境变量：

exportGEMINI_API_KEY="你的密钥"
# 或者
exportMINIMAX_API_KEY="你的密钥"
# 或者
exportOPENAI_API_KEY="你的密钥"

然后直接对话：

你：生成一段海边日落的视频，5秒
Agent：🎬 正在生成视频（需要30秒-5分钟）...视频已生成！

高级配置

如果你想指定模型或参数：

{
"agents":{
"defaults":{
"videoGenerationModel":{
"primary":"minimax/MiniMax-Hailuo-2.3"
}
}
}
}

支持的参数：
- prompt ：视频描述词（必填）
- duration ：时长（3-12秒）
- resolution ：480P/720P/1080P
- ratio ：16:9、9:16、1:1等
- reference_image ：参考图片URL

——————————————

05 Skills插件：一键安装，功能翻倍

除了内置的图像视频能力，OpenClaw还有Skills生态系统，装插件就像装App一样简单。

ClawHub插件市场

访问 clawhub.ai ，有13000+插件可选，分类包括：
- 图像生成
- 视频制作
- 搜索工具
- 写作助手
- 社交媒体
- 办公效率

——————————————

06 免费vs付费：怎么选？

这个问题我被问了很多次。直接上对比：

方案	费用	适合人群	推荐指数
MiniMax内置	免费额度+按量付费	小白用户	⭐⭐⭐⭐⭐
Gemini	有免费额度	有梯子的用户	⭐⭐⭐⭐
DALL-E	按张计费	已经在用GPT的	⭐⭐⭐⭐
NanoPhoto	极低价格	预算有限的	⭐⭐⭐⭐
Sora 2	较贵	专业创作者	⭐⭐⭐

我的建议：
- 小白用户：先用MiniMax内置的，免费额度够玩一阵
- 有梯子：Gemini是个好选择，免费额度多
- 专业用户：按需选择，别心疼钱

——————————————

07 常见问题避坑指南

Q1：生成超时怎么办？

视频生成通常需要30秒到5分钟，耐心等待。如果一直卡着，检查API Key是否有效。

Q2：API限流了？

这是正常的，每个服务都有并发限制。解决方案：
- 错峰使用
- 升级到付费版
- 换一个API Provider

Q3：图片比例不对？

在提示词里明确说：

生成一张16:9比例的风景图

Q4：MiniMax API Key申请失败？

注意端点地址！正确是 api.minimaxi.com ，不是 api.minimax.io 。这个坑我踩过。

Q5：视频生成没反应？

确认你的Provider配置正确，并且API Key有效。可以用命令检查：

openclawmodelslist

——————————————

08 实战案例

说了这么多，来点实际的。

案例：让Agent写一篇科技文章，配图配视频

你：帮我写一篇关于AI大模型的文章
Agent：好的，正在规划内容结构...
（生成文章文案）

你：给这篇文章配一张封面图
Agent：🎨 正在生成...（生成封面图）

你：再加一段展示AI发展历程的视频
Agent：🎬 正在生成视频...（生成视频）

整个过程，你只需要动嘴，Agent全包。

——————————————

09 总结

回到最初的问题：如何让小龙虾具备生图生视频能力？

答案是：通过插件系统。

无论你选择MiniMax、Gemini还是其他Provider，配置过程都不复杂。关键是：
1. 选一个合适的图像/视频生成服务
2. 申请API Key
3. 配置到OpenClaw
4. 直接对话使用

就这么简单。

当然，工具只是工具，关键看你怎么用。有人用它5分钟写了一篇文章+配图+视频，有人装了插件吃灰一个月。

差距不在工具，在人。

——————————————

你用过OpenClaw吗？生图生视频功能体验如何？评论区聊聊～

如果觉得有用，点个赞呗！

——————————————

本文使用OpenClaw辅助创作，图片视频能力配置参考官方文档。

01 小龙虾是谁？凭什么这么火？

02 为什么要给它加生图生视频能力？

03 三种方法让你的小龙虾会画画

方法一：内置MiniMax图像生成（推荐小白）

方法二：Google Gemini图像生成（适合有梯子的）

方法三：OpenAI DALL-E（适合已经用OpenAI的）

04 视频生成：让你的AI成为导演

配置视频生成

高级配置

05 Skills插件：一键安装，功能翻倍

推荐插件

ClawHub插件市场

06 免费vs付费：怎么选？

07 常见问题避坑指南

Q1：生成超时怎么办？

Q2：API限流了？

Q3：图片比例不对？

Q4：MiniMax API Key申请失败？

Q5：视频生成没反应？

08 实战案例

09 总结