OpenAI 新的作图工具颠覆了眼见为实-夜雨聆风

OpenAI 新的作图工具颠覆了眼见为实

GPT-Image 2 终于发到手里了。前几天一直看 demo，没什么感觉。昨晚 Plus 用户已经可以上手在网页版使用。点“+”号，选择创建图片即可。

实测Image2 生图的效果惊人，图像细节完备，几无破绽。眼见为实被彻底颠覆了。

帮我生成一张北京市海淀区中学数学的考卷照片

之前用 Midjourney生图，文字到现在都难以成形。Google 的 Nano Banana解决了大部分文字，特别是汉字生成问题，但在细节上会乱码。Image2 已经彻底颠覆了 AI 生图在文字细节上的刻板印象。

我让它生成一张马斯克在抖音直播间卖火箭的图片，结果如下：

背景上的“抖音 618 科技好物节”，“科技专场”，“人气排名”都是 Image2 自己做主生成的，完全不需要我对细节做更多的描述。它已经知道抖音直播间应该具备的各种元素。

再看另一张，圣斗士的漫画内页彩色版。提示词：生成圣斗士漫画的内页，要彩色画面，角色换成星矢和黄金圣斗士，包含分镜格子，人物动作和姿态，对话气泡，人物对话内容诙谐有趣。

即使看过漫画书的人，如果不是对话内容过于离谱，一时间也难以分辨是否存在这一页。

再来一张普通人会用到的日常画图，司母戊鼎的结构图。提示词：帮我做一张司母戊鼎的结构分析图，包括制造流程。

用以假乱真来形容 Image2 的作品已经不足以形容图片的还原度。我不知道 OpenAI 在图像算法上到底做了什么，GPT 的生图功能在文字呈现上已达到新高度。不仅是中文，各种语言文字都不是问题。

之前Goolge 的 Nano Banana 也可以生成包含文字的完美图片，做出 ppt。但流程相对复杂，不是一句提示词就可以达到细节精细控制。

我很期待把 Image2 的能力集成到 ppt 流程里，做成 skill，对 AI Agent 口述大纲即可快速出品一份能够商用的 pptx。

这意味着，未来的内容创作者不再需要懂设计，会用设计工具，会画图。你只要有审美能力即可，AI 可以完成技法层面的实现。而审美能力的提高显然比磨练技法要容易得多。

对原创画师来说，未来工作的重点应该放在原创形象的创造上。基于原创形象的变体则可以交给 AI 来完成。创造，要比技巧更重要。

对大众来说，市场上流行的各种商业海报，宣传品，不需要太多小众设计，原创思想，GPT 出品的素材几乎立刻可用。生产效率和产品水平被迅速提高。

好处说完了，隐忧也有。

AI 这种生图能力，对依赖图像社交的现代人类来说，最大的冲击不是设计师要失业了，而是造假更容易了。

基于 GPT Image2 的简单使用，我还不能判断，这种逼真的图片是否能在更广泛的使用被滥用。比如基于政治人物的伪造图片，或者假的社会事件。但看起来，不难。

以前我们说，开局一张图，内容全靠编。现在可好，连开局那张图都是编的。如果我们看不出 AI 生图的真假，又如何对外界事物做出评判？

在视觉上形成的欺骗，更难豁免。

我不知道怎么解决这个问题。我只能在接下来的生活中，先假设各种群发的图，视频，都有造假的可能，除非它的信源可靠。