乐于分享
好东西不私藏

AI的发展已是日新月异

AI的发展已是日新月异

又被AI刷屏了!4月16日晚上,OpenAI发布了GPT-image-2图像生成模型。

第二天打开B站、抖音、小红书,全在震惊。弹幕画风统一:“有图有真相的时代彻底结束了!”

从“画个面条”都费劲,到真假难辨

回想AI视频刚火那会儿,连“史密斯吃意大利面”这种基础场景都生成不了,面条糊成一团,鬼畜得不行。

后来Sora上线又下线,在它短暂存在的那段时间里,视频生成技术确实经历了一次质的飞跃。记得当时刷到Sora生成的视频,那种画面质感、光影变化,真的第一次让人产生“这不会是实拍的吧”的恍惚感。

紧接着国内也跟上了。字节跳动的Seedance 2.0一出来,满屏都是“国产之光”。

甚至有人说Seedance 2.0的综合表现已经超过了Sora 2。

最近有个用ai生成的短片《牌子》,我前几天刚看,获得了电影创作比赛的大奖!

7分钟的短片,视觉冲击力特别强,有情节,有思考, 让人不敢相信是ai创作。

r如果不告诉你这是ai,估计很多人都不会想到吧,这转场衔接,已经有电影专业水平了,难怪能得大奖!

要知道距离上面一个史密斯吃面条到如今,也才短短两年,前后两个视频内容已经是天壤之别的区别!

一年一个重磅消已经不够用了,几乎每个月都有新东西冒出来!

然后就是这次的GPT-image-2。

最让我破防的:文案居然全对了

之前我用过不少AI生图工具,有时候生成带文字的图片都气得想砸键盘。

连“生日快乐”这种简单的词都能扭曲成“生曰快东”,更别说很多字的中文海报了,简直没法看。

经常花数小时生成,挑选几张能用的,或者手动ps修正错误。

但GPT-image-2直接把文字准确率从前代的90-95%拉到99%

什么概念?

实测生成的餐厅菜单从店名到价格都清晰可辨,打印出来足以以假乱真。

作为电商行业的,我看到的那一刻,脑子里冒出来的第一个念头是:这东西可以直接做电商详情页了吧?

以前做详情页,文案要反复核对,字体要调整,排版要改来改去。现在给个描述,几秒钟就给你生成一版——2K分辨率起步。

印刷厂无需再筛选可用图片,电商运营可以告别美工修图,自媒体博主能省下图库会员费。最离谱的是它的“Thinking模式”。接到任务后会先思考、规划构图,必要时联网搜索实时信息,生成后还会自我复核,能一次生成八张风格一致的图片。

这个细节真的挺吓人,太强了!我朋友做设计的,都感慨差不多都要失业了。

要知道之前都说ai感,但是现在这些图片,真的一点违和感都没有,那些细节的小字,也都完全没有错误!

以后电商运营是不是只需要会打字就行了?

技术的狂欢与现实的吃相

技术是实打实地在进步,这个不得不服。

但不得不吐槽,有些人吃相确实难看。不是技术不好,就是付费方式让人想骂人。

某视频生成模型,一开始注册给一万多积分,大家用得挺爽,动不动就在群里晒自己生成的“大片”。

可随着用户量激增,算力成了最稀缺的资源。

为了缓解算力压力,开始频繁调整策略——积分越来越少,消耗越来越高。

最骚的操作是:高级会员的积分从15000砍到6160,积分消耗从45涨到90,还搞出VIP专属通道,插队要花210积分,这不就是在VIP头上再叠一个VIP嘛。

一点小感慨

前两年看AI发展,像是挤牙膏,每次更新都是小幅优化。现在呢?几个月就一个重磅,每次出来都让人觉得“卧槽这也行”。

从“史密斯吃意大利面”都生成不了,到GPT-image-2的以假乱真。

设计行业怕是真要洗牌了,影视行业可能也是。还有音乐——AI作曲已经能写完整的交响乐了,虽然有人说“没有灵魂”,但“够用”级别的作品不需要等灵感了。

有人说AI热潮和当年互联网泡沫一样,最终会一地鸡毛。

我不认同,互联网当年确实泡沫破灭过,但活下来的那批公司,彻底改变了世界。AI现在也是,技术本身已经以肉眼可见的速度进化。