open AI上新,有图有真相彻底不存在了-夜雨聆风

open AI上新,有图有真相彻底不存在了

这一整天，你的朋友圈有没有被各式各样的海报、梗图、信息图刷屏？是不是还听到了这样的感慨：“从今往后，真假难辨”“有图有真相此刻开始彻底不存在了”……

当地时间4月22日，OpenAI 图像生成模型大上新，ChatGPT Images 2.0正式发布，即日起对所有ChatGPT和Codex（OpenAI开发的AI代码生成训练模型）用户开放。官方称它为“从渲染工具到视觉系统”的跨越式升级。

为了看看它到底有几把刷子，我的技术同事们今天也在忙着测试它的生成能力。

“真牛啊，你看这个图的美感，真是好到让人哭泣。”临近下班，技术部同事好蔚发过来一张新鲜出炉的AI地图。虽然因为没有在提示词中写明“杭州六小龙”所在区等信息，导致标注不完全准确，但整体美感和细节处理在线。

整体设计在线，但模型缺乏相关知识储备，导致标注地理位置出错。

“今天一上班，高晓老师就跑过来问‘更新了，你试了吗？’以前AI工具上新，他大多很淡定，这还是头一回看他有点兴奋。”好蔚说，“看了今天的几次出图效果，以后只要它继续保持稳定，干活就能轻松一大截。剩下的，就是拼创意和拼想法了。”

下面这幅，就是高晓让ChatGPT Images 2.0生成的书法作品，你觉得如何？

提示词：生成一幅中国唐代颜真卿《祭侄文稿》神韵的横向长卷书法作品，内容为我提供的文字。必须严格参考上传原帖的真实笔法与章法，而不是现代字体排版。风格要求：真正中国书法行草书，颜真卿祭侄稿风格，苍劲雄浑，悲愤激昂，笔势奔涌，气势磅礴。用笔要求：中锋行笔，藏锋起笔，顿挫明显，提按强烈，线条有骨力，粗细变化剧烈，自然飞白，枯润并存，墨色浓淡干湿丰富，局部涨墨、渗墨、断笔自然出现。结构要求：每个字大小不同，欹侧变化明显，重心摇曳但稳定，字形夸张变形，长短错落，连笔自然，不可工整。章法要求：横卷长卷布局，多列竖行文字，自右向左排列，行距宽窄不一，字距疏密变化，穿插避让，整体形成强烈节奏感和视觉冲击力。纸张要求：古旧唐代麻纸卷轴，岁月斑驳，泛黄纸色，纤维肌理清晰，旧藏痕迹，自然磨损。印章要求：多枚朱文印章散落其间，位置自然，仿古收藏印。视觉效果：博物馆级高清扫描质感，真实毛笔墨迹细节，超高分辨率，书法真迹质感。禁止：现代字体感、电脑排版感、字形整齐、机械重复、统一大小、纯黑墨线、装饰海报风。笔触必须像真实毛笔瞬间写成，保留情绪失控的边缘感，而不是设计后的字体。

“其实这个版本模型，如果使用者没有特定需求，不需要专业提示词，也能达到比较理想的效果。”好蔚补充道。

于是，不会写大段专业提示词的我，简单粗暴地扔给它一句话：用一张手绘漫画风格的图，来介绍你自己的优点或强大之处。

我又把今天一篇稿子里其中一段文字“喂”给ChatGPT Images 2.0，让它将内容转换成信息图，同时保持上一条指令的风格。生成的结果，反正我是很满意的。

在同人创作里，有一种叫“捡手机文学”，即假装捡到某个角色的手机，模拟他的聊天记录、朋友圈等。我让GPT Images 2.0生成一张古装电视剧《长相思》角色相柳的朋友圈截图。结果，它用上了相柳的经典台词，评论里的点赞名字也全都是剧中正确的人物角色。这确实有点东西。

海内外网友也是玩得不亦乐乎。

最出圈的，可能是高仿各种社交、购物软件的截图，库克出任小米汽车CEO，罗永浩接任Apple CEO，山姆·阿尔特曼和马斯克在直播间卖瑜伽裤……画风离谱，但细节逼真。

至此，“截图”这件事似乎已经彻底失去了公信力，以后官方发布声明，恐怕都得加一句“非AI生图”，以示严肃。

由于今天的P图传播太广，小米集团董事长特别助理、战略市场部副总经理徐洁云傍晚还发了条微博：“乱P图不可取，可不兴这么乱开玩笑的。”

脑洞大开的网友，还探索出更多玩法，比如生成360°照片。

至于用它生成电影海报、漫画分镜、游戏截图，或者制作电商产品内页图、教学演示等，都还属于正常玩法。就想问一句，还有什么是它不能生成的？

今天凌晨，OpenAI CEO山姆·奥尔特曼也带队开启了一场20多分钟的直播，介绍这款新模型。官方提到，Images 2.0是公司首个具备“思考”能力的图像模型，也是迄今为止功能最强大的图像生成模型。

这次升级最直观的变化，是“听得懂”复杂指令了。此前用AI生图，复杂点的构图就很容易翻车，尤其是图里带文字、密集排版等。Images 2.0在这些细节上进步非常明显，小字、图标、界面元素等都能比较准确地渲染出来；分辨率最高支持2K，图片比例最宽3:1、最窄1:3，做横幅、海报、社交图片可以直接出成品。

官方展示的抹茶店开业广告

第二个明显的能力提升，在于多语言文字生成。用过图片生成工具的人都知道，以前让AI在图里写中文、日文等，错字乱码是常态。Images 2.0能生成语义连贯的非英文文本，终于不用再猜那堆乱码想表达什么了。

OpenAI用来展示多语言生成能力的图

第三个，也是比较有意思的一点是“会思考的图片生成”。在ChatGPT里选择“思考”模式后，Images 2.0可以先联网搜索实时信息、规划图像的骨架结构，甚至能在输出前进行自我检查。同时，一个提示词可以一次性生成最多8张图，且系列间的角色、物体和风格保持高度一致。不过，这个能力目前限 Plus、Pro 和 Business 用户使用。

最后一点就是，它更新了世界知识，目前知识截止时间为2025年12月。这也意味着可以生成更相关，且更符合语境的准确输出。

另外，海外大模型评测机构Arena.ai今天发帖称，GPT Images 2.0已登顶所有Image Arena排行榜第一，在文生图领域以创纪录的242分优势，领先第二名的谷歌Nano banana 2。

GPT Images 2.0的发布，再次让OpenAI站上这一领域的技术高点。但技术越强大，引发的担忧也越深。前不久，山姆·阿尔特曼的住宅就因公众对AI取代人类的焦虑而遭到袭击。这一次，焦虑会进一步蔓延吗？当AI可以轻易制造出任何“真实”，又该如何守住“有图有真相”这条底线？

橙柿财经记者童蔚技术支持张好蔚

编辑李师礼审核顾国飞陈欣文