
OpenClaw:小龙虾AI,一个让AI真正能"干活"的工具
你有没有这种感觉?
AI刚出来的时候,觉得它啥都能干。结果一用,发现它只会聊天,画个图?不好意思,你得去Midjourney。拍个视频?去Runway吧。写个代码?行,但生成图片还是得复制粘贴到别的工具。
这就是传说中的"工具孤岛"问题——每个AI都有自己的擅长,但就是不能串起来用。
今天要聊的,是一个叫 OpenClaw 的开源AI Agent框架,中文名叫"小龙虾"。它解决的核心问题就是: 让你的AI不仅能聊天,还能直接生图、生视频,而且全部在一个对话里搞定。
01 小龙虾是谁?凭什么这么火?
先给不了解的朋友科普一下。
OpenClaw是2025年底出来的一个开源AI工具,上线几个月GitHub星标就突破了34万。这什么概念?比很多老牌开源项目都猛。

它的核心理念很有意思: "The AI that actually does things" ——翻译成人话就是:这个AI是真的能干活,不是只会耍嘴皮子。
传统的AI助手,你问它问题,它给你回答。
小龙虾不一样。你让它帮你写一份报告,它真的能:
- 打开电脑找到文件
- 分析内容
- 联网查资料
- 生成配图
- 发邮件给你
全程自动,你只需要说一句话。
这才是我想要的AI好吗!
02 为什么要给它加生图生视频能力?
好,问题来了——小龙虾默认没有生图生视频能力吗?
答:默认情况下,它真的没有。
这不怪它。AI Agent的核心是"执行任务",默认专注于文字处理和工具调用。图像和视频生成属于另一个领域,需要专门的模型和API。
但是!
通过插件系统,小龙虾可以轻松获得这些能力。而且一旦装上,你就可以在对话里直接说"帮我画一张图"或者"生成一段视频",Agent自动帮你搞定一切。
想象一下这个场景:
- 你让Agent写一篇产品介绍
- 它自动生成了文案
- 同时生成了配套的产品图
- 还生成了一段展示视频
- 全程你只动了一张嘴
这不比那些"人工智障"强多了?
03 三种方法让你的小龙虾会画画
根据我的实测,给小龙虾增加生图能力有三条路:
方法一:内置MiniMax图像生成(推荐小白)
这是2026年3月底3.28版本更新的重磅功能。
优点:
- 开箱即用,配置超简单
- 画质不错,速度快
- 支持文生图和图生图
缺点:
- 需要MiniMax的API Key
- 国内用户申请稍微麻烦点
配置步骤:
第一步:去MiniMax开放平台申请API Key
访问:platform.minimaxi.com
注册账号 → 创建应用 → 获取API Key
第二步:配置环境变量
exportMINIMAX_API_KEY="你的密钥"
第三步:在配置文件中设置图像生成模型
{
"agents":{
"defaults":{
"imageGenerationModel":{
"primary":"minimax/image-01"
}
}
}
}
第四步:直接开画!
你:帮我画一只穿着西装的猫,在纽约时代广场
Agent:🎨 正在生成...(几秒后)图片出来了
支持的比例:1:1、16:9、4:3、3:2、2:3、3:4、9:16、21:9
一次最多生成9张图,够你挑了吧?
方法二:Google Gemini图像生成(适合有梯子的)
如果你已经有Google AI的使用习惯,用Gemini也是个好选择。
优点:
- 画质极其出色
- 支持4K超清输出
- 有免费额度
配置步骤:
第一步:获取Gemini API Key
访问:ai.google.dev
登录 → 创建API Key
第二步:设置环境变量
exportGEMINI_API_KEY="你的密钥"
第三步:配置文件
{
"agents":{
"defaults":{
"imageGenerationModel":"google/gemini-3-pro-image-preview"
}
}
}
第四步:开画!
你:生成一张赛博朋克风格的东京夜景
Agent:✨ 正在生成高清图像...
方法三:OpenAI DALL-E(适合已经用OpenAI的)
如果你已经在用GPT,配个DALL-E是最顺滑的选择。
配置:
{
"skills":{
"imageGen":{
"provider":"openai",
"model":"dall-e-3",
"apiKey":"${OPENAI_API_KEY}",
"defaultSize":"1024x1024",
"defaultQuality":"standard"
}
}
}
04 视频生成:让你的AI成为导演
说完生图,再来说说更刺激的—— 生视频 。
2026年4月,OpenClaw正式支持视频生成,接入了 12家 主流视频生成提供商。这阵容,比很多专业视频工具都猛:

配置视频生成
最简单的配置——直接设置环境变量:
exportGEMINI_API_KEY="你的密钥"
# 或者
exportMINIMAX_API_KEY="你的密钥"
# 或者
exportOPENAI_API_KEY="你的密钥"
然后直接对话:
你:生成一段海边日落的视频,5秒
Agent:🎬 正在生成视频(需要30秒-5分钟)...视频已生成!
高级配置
如果你想指定模型或参数:
{
"agents":{
"defaults":{
"videoGenerationModel":{
"primary":"minimax/MiniMax-Hailuo-2.3"
}
}
}
}
支持的参数:
- prompt :视频描述词(必填)
- duration :时长(3-12秒)
- resolution :480P/720P/1080P
- ratio :16:9、9:16、1:1等
- reference_image :参考图片URL
05 Skills插件:一键安装,功能翻倍
除了内置的图像视频能力,OpenClaw还有Skills生态系统,装插件就像装App一样简单。

推荐插件
1. NanoPhoto生图插件
npxclawhubinstallnanophoto-nano-banana-pro
费用:2K约0.05美元/张,4K约0.1美元/张 优点:便宜,画质不错
2. Sora 2视频生成插件
npxclawhubinstallsora-2-generate
支持Sora 2模型 费用:10秒约0.3美元,20秒约0.5美元
3. OpenClaw Media Gen
- 一个插件搞定图片+视频
- 图片用Gemini,视频用Wan 2.6
ClawHub插件市场
访问 clawhub.ai ,有13000+插件可选,分类包括:
- 图像生成
- 视频制作
- 搜索工具
- 写作助手
- 社交媒体
- 办公效率
06 免费vs付费:怎么选?
这个问题我被问了很多次。直接上对比:
我的建议:
- 小白用户:先用MiniMax内置的,免费额度够玩一阵
- 有梯子:Gemini是个好选择,免费额度多
- 专业用户:按需选择,别心疼钱
07 常见问题避坑指南
Q1:生成超时怎么办?
视频生成通常需要30秒到5分钟,耐心等待。如果一直卡着,检查API Key是否有效。
Q2:API限流了?
这是正常的,每个服务都有并发限制。解决方案:
- 错峰使用
- 升级到付费版
- 换一个API Provider
Q3:图片比例不对?
在提示词里明确说:
生成一张16:9比例的风景图
Q4:MiniMax API Key申请失败?
注意端点地址!正确是 api.minimaxi.com ,不是 api.minimax.io 。这个坑我踩过。
Q5:视频生成没反应?
确认你的Provider配置正确,并且API Key有效。可以用命令检查:
openclawmodelslist
08 实战案例
说了这么多,来点实际的。
案例:让Agent写一篇科技文章,配图配视频
你:帮我写一篇关于AI大模型的文章
Agent:好的,正在规划内容结构...
(生成文章文案)
你:给这篇文章配一张封面图
Agent:🎨 正在生成...(生成封面图)
你:再加一段展示AI发展历程的视频
Agent:🎬 正在生成视频...(生成视频)
整个过程,你只需要动嘴,Agent全包。
09 总结
回到最初的问题:如何让小龙虾具备生图生视频能力?
答案是:通过插件系统。
无论你选择MiniMax、Gemini还是其他Provider,配置过程都不复杂。关键是:
1. 选一个合适的图像/视频生成服务
2. 申请API Key
3. 配置到OpenClaw
4. 直接对话使用
就这么简单。
当然,工具只是工具,关键看你怎么用。有人用它5分钟写了一篇文章+配图+视频,有人装了插件吃灰一个月。
差距不在工具,在人。
你用过OpenClaw吗?生图生视频功能体验如何?评论区聊聊~
如果觉得有用,点个赞呗!
本文使用OpenClaw辅助创作,图片视频能力配置参考官方文档。
夜雨聆风