open AI上新,有图有真相彻底不存在了
这一整天,你的朋友圈有没有被各式各样的海报、梗图、信息图刷屏?是不是还听到了这样的感慨:“从今往后,真假难辨”“有图有真相此刻开始彻底不存在了”……

当地时间4月22日,OpenAI 图像生成模型大上新,ChatGPT Images 2.0正式发布,即日起对所有ChatGPT和Codex(OpenAI开发的AI代码生成训练模型)用户开放。官方称它为“从渲染工具到视觉系统”的跨越式升级。

为了看看它到底有几把刷子,我的技术同事们今天也在忙着测试它的生成能力。
“真牛啊,你看这个图的美感,真是好到让人哭泣。”临近下班,技术部同事好蔚发过来一张新鲜出炉的AI地图。虽然因为没有在提示词中写明“杭州六小龙”所在区等信息,导致标注不完全准确,但整体美感和细节处理在线。

整体设计在线,但模型缺乏相关知识储备,导致标注地理位置出错。
“今天一上班,高晓老师就跑过来问‘更新了,你试了吗?’以前AI工具上新,他大多很淡定,这还是头一回看他有点兴奋。”好蔚说,“看了今天的几次出图效果,以后只要它继续保持稳定,干活就能轻松一大截。剩下的,就是拼创意和拼想法了。”
下面这幅,就是高晓让ChatGPT Images 2.0生成的书法作品,你觉得如何?

提示词:生成一幅中国唐代颜真卿《祭侄文稿》神韵的横向长卷书法作品,内容为我提供的文字。必须严格参考上传原帖的真实笔法与章法,而不是现代字体排版。风格要求:真正中国书法行草书,颜真卿祭侄稿风格,苍劲雄浑,悲愤激昂,笔势奔涌,气势磅礴。用笔要求:中锋行笔,藏锋起笔,顿挫明显,提按强烈,线条有骨力,粗细变化剧烈,自然飞白,枯润并存,墨色浓淡干湿丰富,局部涨墨、渗墨、断笔自然出现。结构要求:每个字大小不同,欹侧变化明显,重心摇曳但稳定,字形夸张变形,长短错落,连笔自然,不可工整。章法要求:横卷长卷布局,多列竖行文字,自右向左排列,行距宽窄不一,字距疏密变化,穿插避让,整体形成强烈节奏感和视觉冲击力。纸张要求:古旧唐代麻纸卷轴,岁月斑驳,泛黄纸色,纤维肌理清晰,旧藏痕迹,自然磨损。印章要求:多枚朱文印章散落其间,位置自然,仿古收藏印。视觉效果:博物馆级高清扫描质感,真实毛笔墨迹细节,超高分辨率,书法真迹质感。禁止:现代字体感、电脑排版感、字形整齐、机械重复、统一大小、纯黑墨线、装饰海报风。笔触必须像真实毛笔瞬间写成,保留情绪失控的边缘感,而不是设计后的字体。
“其实这个版本模型,如果使用者没有特定需求,不需要专业提示词,也能达到比较理想的效果。”好蔚补充道。
于是,不会写大段专业提示词的我,简单粗暴地扔给它一句话:用一张手绘漫画风格的图,来介绍你自己的优点或强大之处。

我又把今天一篇稿子里其中一段文字“喂”给ChatGPT Images 2.0,让它将内容转换成信息图,同时保持上一条指令的风格。生成的结果,反正我是很满意的。

在同人创作里,有一种叫“捡手机文学”,即假装捡到某个角色的手机,模拟他的聊天记录、朋友圈等。我让GPT Images 2.0生成一张古装电视剧《长相思》角色相柳的朋友圈截图。结果,它用上了相柳的经典台词,评论里的点赞名字也全都是剧中正确的人物角色。这确实有点东西。

海内外网友也是玩得不亦乐乎。
最出圈的,可能是高仿各种社交、购物软件的截图,库克出任小米汽车CEO,罗永浩接任Apple CEO,山姆·阿尔特曼和马斯克在直播间卖瑜伽裤……画风离谱,但细节逼真。


至此,“截图”这件事似乎已经彻底失去了公信力,以后官方发布声明,恐怕都得加一句“非AI生图”,以示严肃。
由于今天的P图传播太广,小米集团董事长特别助理、战略市场部副总经理徐洁云傍晚还发了条微博:“乱P图不可取,可不兴这么乱开玩笑的。”
脑洞大开的网友,还探索出更多玩法,比如生成360°照片。

至于用它生成电影海报、漫画分镜、游戏截图,或者制作电商产品内页图、教学演示等,都还属于正常玩法。就想问一句,还有什么是它不能生成的?


今天凌晨,OpenAI CEO山姆·奥尔特曼也带队开启了一场20多分钟的直播,介绍这款新模型。官方提到,Images 2.0是公司首个具备“思考”能力的图像模型,也是迄今为止功能最强大的图像生成模型。
这次升级最直观的变化,是“听得懂”复杂指令了。此前用AI生图,复杂点的构图就很容易翻车,尤其是图里带文字、密集排版等。Images 2.0在这些细节上进步非常明显,小字、图标、界面元素等都能比较准确地渲染出来;分辨率最高支持2K,图片比例最宽3:1、最窄1:3,做横幅、海报、社交图片可以直接出成品。

官方展示的抹茶店开业广告
第二个明显的能力提升,在于多语言文字生成。用过图片生成工具的人都知道,以前让AI在图里写中文、日文等,错字乱码是常态。Images 2.0能生成语义连贯的非英文文本,终于不用再猜那堆乱码想表达什么了。

OpenAI用来展示多语言生成能力的图
第三个,也是比较有意思的一点是“会思考的图片生成”。在ChatGPT里选择“思考”模式后,Images 2.0可以先联网搜索实时信息、规划图像的骨架结构,甚至能在输出前进行自我检查。同时,一个提示词可以一次性生成最多8张图,且系列间的角色、物体和风格保持高度一致。不过,这个能力目前限 Plus、Pro 和 Business 用户使用。
最后一点就是,它更新了世界知识,目前知识截止时间为2025年12月。这也意味着可以生成更相关,且更符合语境的准确输出。
另外,海外大模型评测机构Arena.ai今天发帖称,GPT Images 2.0已登顶所有Image Arena排行榜第一,在文生图领域以创纪录的242分优势,领先第二名的谷歌Nano banana 2。
GPT Images 2.0的发布,再次让OpenAI站上这一领域的技术高点。但技术越强大,引发的担忧也越深。前不久,山姆·阿尔特曼的住宅就因公众对AI取代人类的焦虑而遭到袭击。这一次,焦虑会进一步蔓延吗?当AI可以轻易制造出任何“真实”,又该如何守住“有图有真相”这条底线?
橙柿财经 记者 童蔚技术支持 张好蔚
编辑 李师礼审核 顾国飞 陈欣文
夜雨聆风