乐于分享
好东西不私藏

OpenAI 新的作图工具颠覆了眼见为实

OpenAI 新的作图工具颠覆了眼见为实

GPT-Image 2 终于发到手里了。前几天一直看 demo,没什么感觉。昨晚 Plus 用户已经可以上手在网页版使用。点“+”号,选择创建图片即可。

实测Image2 生图的效果惊人,图像细节完备,几无破绽。眼见为实被彻底颠覆了。

帮我生成一张北京市海淀区中学数学的考卷照片

之前用 Midjourney生图,文字到现在都难以成形。Google 的 Nano Banana解决了大部分文字,特别是汉字生成问题,但在细节上会乱码。Image2 已经彻底颠覆了 AI 生图在文字细节上的刻板印象。

我让它生成一张马斯克在抖音直播间卖火箭的图片,结果如下:

背景上的“抖音 618 科技好物节”,“科技专场”,“人气排名”都是 Image2 自己做主生成的,完全不需要我对细节做更多的描述。它已经知道抖音直播间应该具备的各种元素。

再看另一张,圣斗士的漫画内页彩色版。提示词: 生成圣斗士漫画的内页,要彩色画面,角色换成星矢和黄金圣斗士,包含分镜格子,人物动作和姿态,对话气泡,人物对话内容诙谐有趣。

即使看过漫画书的人,如果不是对话内容过于离谱,一时间也难以分辨是否存在这一页。

再来一张普通人会用到的日常画图,司母戊鼎的结构图。提示词: 帮我做一张司母戊鼎的结构分析图,包括制造流程。

用以假乱真来形容 Image2 的作品已经不足以形容图片的还原度。我不知道 OpenAI 在图像算法上到底做了什么,GPT 的生图功能在文字呈现上已达到新高度。不仅是中文,各种语言文字都不是问题。

之前Goolge 的 Nano Banana 也可以生成包含文字的完美图片,做出 ppt。但流程相对复杂,不是一句提示词就可以达到细节精细控制。

我很期待把 Image2 的能力集成到 ppt 流程里,做成 skill,对 AI Agent 口述大纲即可快速出品一份能够商用的 pptx。

这意味着,未来的内容创作者不再需要懂设计,会用设计工具,会画图。你只要有审美能力即可,AI 可以完成技法层面的实现。而审美能力的提高显然比磨练技法要容易得多。

对原创画师来说,未来工作的重点应该放在原创形象的创造上。基于原创形象的变体则可以交给 AI 来完成。创造,要比技巧更重要。

对大众来说,市场上流行的各种商业海报,宣传品,不需要太多小众设计,原创思想,GPT 出品的素材几乎立刻可用。生产效率和产品水平被迅速提高。

好处说完了,隐忧也有。

AI 这种生图能力,对依赖图像社交的现代人类来说,最大的冲击不是设计师要失业了,而是造假更容易了。

基于 GPT Image2 的简单使用,我还不能判断,这种逼真的图片是否能在更广泛的使用被滥用。比如基于政治人物的伪造图片,或者假的社会事件。但看起来,不难。

以前我们说,开局一张图,内容全靠编。现在可好,连开局那张图都是编的。如果我们看不出 AI 生图的真假,又如何对外界事物做出评判?

在视觉上形成的欺骗,更难豁免。

我不知道怎么解决这个问题。我只能在接下来的生活中,先假设各种群发的图,视频,都有造假的可能,除非它的信源可靠。