乐于分享
好东西不私藏

open claw接入绘图功能-AiPhotoPro – AI 图片生成SKILL

open claw接入绘图功能-AiPhotoPro – AI 图片生成SKILL

AiPhotoPro – AI 图片生成SKILL

open claw效果:

本项目已经上传至https://clawdhub.com/skill/ai-photo-pro 文末附上高级提示词

通过 NVIDIA NIM API 或 SiliconFlow API 生成图片。支持 Kolors (快手可图)、Qwen-Image (通义千问)、flux.2-klein-4b 等模型。当用户要求”生成图片”、“画一张图”、”AI绘图”或类似表达时调用。支持中文提示词,返回图片文件路径。

支持双引擎:NVIDIA NIM API(flux.2-klein-4b)和 SiliconFlow API(Kolors / Qwen-Image)。

  • NVID API Key : https://nim.nvidia.com
    : NVID 审核有点过于严格了 注册获取(英文有些单词会直接被pass,或者部分出现敏感词也会,没有研究具体哪些词,但是支持中文,中文审核反而正常返回了)
  • SiliconFlow API Key : https://cloud.siliconflow.cn/i/IOo0eaWy
    : 硅基流动(推荐,审核较正常) 注册获取

调用方式

命令行(推荐)

SiliconFlow - 可图 Kolors(默认)python /home/ubuntu/.openclaw/skills/ai-photo-pro/scripts/siliconflow_main.py "<提示词>" ["<负面提示词>"]SiliconFlow - 通义千问 Qwen-Image(付费模型,建议按需选取)python /home/ubuntu/.openclaw/skills/ai-photo-pro/scripts/siliconflow_main.py "<提示词>" ["<负面提示词>"] --model Qwen/Qwen-ImageNVIDIA NIM API - flux.2-klein-4bpython /home/ubuntu/.openclaw/skills/ai-photo-pro/scripts/nvid_main.py "<提示词>"

Python 导入

import syssys.path.insert(0'/home/ubuntu/.openclaw/skills/ai-photo-pro/scripts')# SiliconFlowfrom siliconflow_main import generate_pngimg_list = generate_png(model="Kwai-Kolors/Kolors", base_str="<提示词>", negative_prompt="<负面提示词>")# NVIDIAfrom nvid_main import run_pngvidapiimg_path = run_pngvidapi(model="flux.2-klein-4b", base_str="<提示词>")

参数说明

SiliconFlow generate_png()

参数
类型
必填
说明
model
string
模型名,默认 Kwai-Kolors/Kolors,可选 Qwen/Qwen-Image(付费模型,建议按需选取)
base_str
string
中文提示词
negative_prompt
string
负面提示词,可空
batch_size
int
批量大小,默认 1
num_inference_steps
int
推理步骤数,默认 20
guidance_scale
float
提示词匹配度,默认 2.5

NVIDIA run_pngvidapi()

参数
类型
必填
说明
model
string
固定填 flux.2-klein-4b
base_str
string
中文提示词

输出

  • 图片保存路径:/home/ubuntu/.openclaw/skills/ai-photo-pro/scripts/img_data/<model>_<timestamp>.png
  • 函数返回值为图片路径列表

API Key 配置

首次使用需配置 API Key,运行交互式配置脚本:

python /home/ubuntu/.openclaw/skills/ai-photo-pro/scripts/config_json.py

或手动写入 config.json(位于 scripts/ 目录):

{  "NVID": "nvapi-你的NVID密钥",  "SILICONFLOW": "sk-你的SiliconFlow密钥"}

获取 Key

  • NVID API Key
    : https://nim.nvidia.com
  • SiliconFlow API Key
    : https://cloud.siliconflow.cn/i/IOo0eaWy

简单操作示例提示词

1.物体/场景示范:

一个小苹果,红彤彤的,挂在绿叶树枝上,阳光照射,背景是模糊的果园,摄影风格,高清细节

 可以看到使用了硅基流动免费的模型2.人物:

一位美丽的短发东亚女性坐在高层公寓的落地窗前,身穿紧身的白色衬衫,(光线是午后柔和的定向自然光,在人物身上形成优美的明暗轮廓),脸上带着温暖而亲密的微笑,皮肤毛孔清晰,虹膜清晰锐利

直接命令AI使用千问的模型

3.风格化:

赛博朋克城市夜景,霓虹灯光,雨后街道,反射,高对比度,电影感

命令AI使用NVID

注意事项

  • SiliconFlow 默认尺寸 1024×1024,steps=20
  • NVIDIA 默认尺寸 1024×1024,steps=4(更快)
  • 生成失败 SiliconFlow 会抛出异常;NVIDIA 会自动重试最多 5 次
  • 图片路径通过函数返回值传递,方便 agent 捕获并发送

高级提示词示范

韩式自拍

杰作,逼真写实,(这是一部 90 年代的低音调电影画面,描绘了一位年轻、可爱的韩国流行偶像,她有着纯净、天真的面容:1.4),(在一个温馨、杂乱的卧室里,有一面巨大的复古壁镜,上面贴满了可爱的贴纸和相片:1.3),她穿着一件超大号的彩色复古针织开衫,外面套着一件有图案的婴儿T恤,(在脸颊旁做出一个小手指心形的动作,带着温柔、温暖的笑容,看着镜子里自己的倒影:1.5),柔顺的深色波浪卷发,带有刘海,色彩鲜艳的复古发夹,(技术效果:背景和边缘有强烈的水平运动模糊(推移条纹),而主体则被摄像机上的直接闪光灯清晰地冻结:1.6),她身后有刺眼的闪光阴影,镜子中可以看到闪光灯的明亮镜面反射,(胶片模拟:富士超级亚 800,厚重的胶片颗粒,漏光,灰尘斑点,温暖的绿色色调,鲜艳的色彩,低音风格美学:1.5),——纵横比 4:5

办公照片

一位美丽的短发东亚女性坐在高层公寓的落地窗前,身穿紧身的白色衬衫(地点:(室内),背景:(光线充足,高层玻璃窗户),场景要求:加强(光线是午后或清晨柔和的 定向自然光,在人物身上形成优美的明暗轮廓)),(主体:(东亚女性),美型风格:(自然的肤质,清晰的眉毛,淡淡的光泽),妆容搭配:(淡妆),动作:(坐在高层公寓的落地窗 前,以略带仰视的第一人称视角凝视着你,模拟真实对话距离,脸上带着温暖而亲密的微笑),人物要求:加强(可见的皮肤毛孔,真实皮肤纹理,皮肤细节,皮下散射,虹膜清 晰锐利,瞳孔边界分明),人物负面提示词:避免(丑陋,畸形,面部结构扭曲,头比例不协调,头大小异常,畸形的肢体,眼睛扭曲,大小眼,瞳孔变形,眼白异常模糊,斗鸡 眼,斜视,眼神涣散,眼白过曝,眼白虚化,眼白消失)(手部结构错误,关节位置异常,手部穿模)(塑料皮肤,蜡像感,橡胶皮肤,3D建模感,油腻)(西方人面相)(表情僵 硬,傻笑,怒视,假笑,无眼神交流)),柔和的自然窗光洒入室内,光影富有层次,画面带有电影般的质感和叙事氛围,浅景深,胶片颗粒感

办公照片

生成一张2:3比例、具有高级时尚杂志质感与电影氛围的摄影作品。核心是呈现一位拥有沙漏型身材、面容精致的韩国美女,身处冰冷工业废墟中,营造脆弱美感与粗粝环境的极致对比。她身穿一套凸显身材曲线的纯白色细绳比基尼。黑色长发梳成松散的低麻花辫,额前有飘逸的刘海,戴白色网状发带。配饰包括金色圆环耳环,以及一个带有超大金色铃铛的黑色皮革项圈。她赤裸双足,一双透明塑料高跟鞋被随意弃置一旁。她坐在废弃工厂的水泥地上,构图采用稍高的俯视角度。姿态静止而脆弱:身体微后仰,右手支撑,右膝曲起。眼神向下、向侧方看去,避开镜头,表情是带着沉思与忧郁的安静顺从,嘴唇微张。用光至关重要:一道方向性极强的硬质阳光(模拟从破口射入)在她身体和脸上投下清晰、锐利的几何形状阴影。焦点必须极致锐利地锁定在她的皮肤、织物和面部,背景的锈迹与杂物则需适度虚化。画面必须超写实,突出皮肤的天鹅绒质感、金属的锈蚀、不同织物的纹理。整体氛围是电影感的、孤独的、具有故事性的瞬间捕捉。需严格避免:任何动漫或3D渲染感、平光、整洁背景、面对镜头的微笑、眼神接触、身体畸形、文字水印。最终成像应达到顶级商业摄影的清晰度与质感。

负面提示词(可选):

(塑料皮肤,蜡像感,橡胶皮肤,3D建模感,油腻:2)(身体部分缺失,身体透明,身体溶解:1.9),(胸部结构异常,胸部大小不一,胸部变形:1.9),(下半身缺失,下半身透明:1.9),(不完整的身体,截断的身体:1.8)

加入负面提示词情况: