作为一个经常需要配图的内容创作者,我试过各种AI生图方案:ChatGPT的DALL-E要反复登录、Grok生图每次都要手动输入提示词、想用参考图还得一张张上传……更别提批量生成几十张图时的重复劳动。
直到我开发了这款“ChatGPT&Grok生图工具”,它把两个平台的批量自动化流程打通了。今天就从实战角度,分享它如何解决我的出图痛点。
📋 Excel批量提示词,告别逐条手动输入
以前我需要在ChatGPT和Grok之间来回切换,每条提示词复制粘贴、等待生成、保存图片,一天只能产出十几张。这个工具的核心机制是:从Excel读取提示词。你只需创建一个Prompt.xlsx文件,A列放GPT的提示词,B列放Grok的提示词,工具会自动逐条处理。
读取Excel中的提示词forrinrange(2,ws.max_row+1):gpt_val=ws.cell(r,1).value grok_val=ws.cell(r,2).value prompts.append({"id":str(r-1),"gpt_prompt":gpt_text,"grok_prompt":grok_text,})
更贴心的是,你还可以设置固定后缀提示词——比如在GPT后面自动加上“直接生成1∶1九宫格图片发给我,无需回复文字内容”,在Grok后面加上“保持图片完整,无其他多余内容”。这样每条提示词都能保持一致的行为,无需重复输入。

🖼️ 参考图子文件夹,每个提示词的专属素材库
很多AI生图场景需要参考图:比如产品图、角色设定、风格参考。这个工具支持按提示词序号匹配子文件夹。参考图目录下可以建多个子文件夹(如“图1”“图2”),每个子文件夹对应Excel中的一条提示词。你还可以设置“每次上传图片数”(比如取前3张),以及上传后的等待时间(确保图片完全上传再发送)。这样每条提示词都能带上不同的参考素材,实现精细化生图。
sub_dirs=sorted([dfordinos.listdir(ref_dir)ifos.path.isdir(os.path.join(ref_dir,d))])sub_dir=os.path.join(ref_dir,sub_dirs[prompt_index])
取前 ref_count 张图片files=sorted([...])[:ref_count]file_input.input(files)# 批量上传
🔄 双平台同时运行,创意接力升级
最让我惊喜的是“同时运行”模式:GPT先生成图片,然后Grok参考这些图片再进行生成。这意味着你可以先用GPT的DALL-E生成一批高质量参考图,然后让Grok基于这些图继续创作——比如风格迁移、细节增强、多角度生成。工具内部使用了队列机制,GPT每完成一条,就会把生成的图片路径传给Grok线程,Grok自动将这些图片作为参考图上传并生成新图片。整个过程无需人工干预,相当于两个AI模型接力创作。
GPT完成后将图片路径放入队列gpt_queue.put({"grok_prompt":item.get("grok_prompt",""),"subfolder":subfolder,"gpt_images":gpt_images,# 传给Grok作为参考})# Grok线程从队列获取后自动使用success=self._grok_send_prompt_and_wait(...,ref_images=gpt_images)
💾 智能图片检测与保存,不丢一张图
工具内置了两种图片检测方法:一是等待AI回复中的“停止生成”按钮消失(表示生成完成),二是直接扫描页面中符合条件的img标签。对于GPT,它会过滤掉小图标、头像等无关图片,只保留大尺寸生成图;对于Grok,它会锁定assets.grok.com域名的图片。下载支持HTTP直接请求和Base64解码,同时可以复用浏览器Cookies,避免403错误。每张图片会按ID自动命名(如1.png、2_1.png表示第一条提示词的第一张图),并保存到你指定的目录。
检测生成状态的核心逻辑ifbm.name=="GPT":is_gen=tab.ele('css:button[data-testid="stop-button"]',timeout=1)isnotNone# 生成完成后扫描图片imgs=tab.eles('css:img[src*="oaidalleapiprodscus"]')
🍪 持久化登录,一次登录用到天荒地老
无论是ChatGPT还是Grok,登录都是最烦的环节。这个工具将Cookies保存到本地文件(gpt/cookies.json和grok/cookies.json),下次启动自动加载,无需重新登录。如果检测到登录过期(比如找不到输入框),它会自动尝试重新加载Cookies并刷新页面。你只需要在第一次使用时点击“登录账号”按钮,手动完成登录即可,之后全自动。
defcheck_login(self):ifself.name=="GPT":chat_input=self.page.ele('css:div#prompt-textarea',timeout=5)returnchat_inputisnotNone
Grok同理
⚙️ 灵活参数,适配不同网络和需求
你可以在界面上设置:
发送间隔:每条提示词之间的等待时间,避免被限流。
等待图片超时:最长等待生成的时间,超过则跳过。
显示浏览器:调试时可以看着浏览器操作,批量运行时可以关闭(无头模式)。
上传等待时间:上传参考图后等待几秒再发送提示词,确保文件完整。
这些参数让工具可以适应不同网络环境和AI服务响应速度,稳如老狗。
🎯 总结:适合谁用?
AI绘画爱好者:想同时体验DALL-E和Grok的生成效果,批量对比。
电商设计:需要为每个商品生成多张不同风格图,且要求使用统一参考图。
自媒体配图:日更需要大量配图,不想在登录、复制、粘贴上浪费时间。
AI工作流搭建者:希望将GPT和Grok串联起来,实现“创意接力”的自动化。
这款工具的本质是一个跨平台AI生图自动化引擎——从Excel读取任务、自动登录、上传参考图、发送提示词、检测生成、保存图片,全流程无人值守。如果你也在为批量生图的效率发愁,不妨试试这个思路,或许会成为你的生产力神器。
🎯步里软件【编号2614】ChatGPT&Grok生图工具下载地址
ChatGPT批量生图,Grok生图自动化,DALL-E批量生成,AI图片批量下载,Prompt批量处理,参考图上传自动化,AI生图工具,双平台生图,cookie持久化登录,DrissionPage自动化
夜雨聆风