在AI时代,图片和视频生成已经成为日常工作的标配。但大多数工具要么需要联网、要么需要付费、要么隐私存疑。今天介绍OpenClaw的6大本地媒体生成技能,让你在自己的电脑上就能完成从图片到视频的全流程创作。
一、豆包生图:doubao-image

一句话介绍:用字节跳动的豆包大模型生成高质量图片,无需本地显卡。
核心能力:
支持文生图、图生图 多种风格可选(写实、动漫、油画等) 中文提示词友好
使用场景:
公众号配图 产品原型图 创意灵感收集
实测体验:生成512x512图片约3-5秒,质量稳定,适合快速出图。
二、纯代码画图:canvas-design

一句话介绍:用Python代码直接生成设计图,无需调用外部API。
核心能力:
PIL/Pillow底层绘制 支持文字、几何图形、渐变 完全离线,零依赖
使用场景:
数据可视化 流程图、架构图 简单海报设计
实测体验:适合技术向用户,代码可控性强,生成速度快。
三、本地模型生图:local-image-gen-aipc

一句话介绍:在本地运行Stable Diffusion模型,完全离线,隐私无忧。
核心能力:
基于OpenVINO加速 支持Intel核显和NVIDIA显卡 自定义模型加载
使用场景:
隐私敏感的内容生成 批量图片生产 定制化风格训练
实测体验:512x512图片约60-80秒(CPU模式),质量与在线模型相当。
四、图生视频:svd-video-gen

一句话介绍:用Stable Video Diffusion将静态图片变成动态视频。
核心能力:
图片转4秒短视频 多种运动模式 本地运行,无需联网
使用场景:
社交媒体动态内容 产品展示视频 创意短片制作
实测体验:4秒视频约2-3分钟生成,运动自然流畅。
五、GIF制作:gif-maker

一句话介绍:快速制作循环播放的GIF动图。
核心能力:
视频转GIF 图片序列转GIF 自定义帧率、尺寸
使用场景:
表情包制作 教程演示 网页动效
实测体验:转换速度快,支持参数微调,文件体积可控。
六、视频抽帧:video-frames

一句话介绍:从视频中提取关键帧,用于分析或重新创作。
核心能力:
按时间间隔抽帧 按场景变化抽帧 批量处理
使用场景:
视频内容分析 素材收集 缩略图生成
实测体验:提取速度快,支持多种输出格式。
总结
OpenClaw的这6大技能覆盖了从图片生成到视频处理的全流程:
| 技能 | 类型 | 联网需求 | 适用场景 |
|---|---|---|---|
| doubao-image | 图片 | 需要 | 快速出图 |
| canvas-design | 图片 | 不需要 | 技术绘图 |
| local-image-gen-aipc | 图片 | 不需要 | 隐私/批量 |
| svd-video-gen | 视频 | 不需要 | 图生视频 |
| gif-maker | 动图 | 不需要 | 表情包 |
| video-frames | 视频 | 不需要 | 素材提取 |
建议组合:
日常快速出图 → doubao-image 隐私敏感内容 → local-image-gen-aipc 动态内容 → svd-video-gen + gif-maker
所有技能都可通过OpenClaw一键调用,无需复杂配置。赶紧试试吧!
夜雨聆风