AI的发展已是日新月异-夜雨聆风

AI的发展已是日新月异

又被AI刷屏了！4月16日晚上，OpenAI发布了GPT-image-2图像生成模型。

第二天打开B站、抖音、小红书，全在震惊。弹幕画风统一：“有图有真相的时代彻底结束了！”

回想AI视频刚火那会儿，连“史密斯吃意大利面”这种基础场景都生成不了，面条糊成一团，鬼畜得不行。

后来Sora上线又下线，在它短暂存在的那段时间里，视频生成技术确实经历了一次质的飞跃。记得当时刷到Sora生成的视频，那种画面质感、光影变化，真的第一次让人产生“这不会是实拍的吧”的恍惚感。

紧接着国内也跟上了。字节跳动的Seedance 2.0一出来，满屏都是“国产之光”。

甚至有人说Seedance 2.0的综合表现已经超过了Sora 2。

最近有个用ai生成的短片《牌子》，我前几天刚看，获得了电影创作比赛的大奖！

7分钟的短片，视觉冲击力特别强，有情节，有思考，让人不敢相信是ai创作。

r如果不告诉你这是ai，估计很多人都不会想到吧，这转场衔接，已经有电影专业水平了，难怪能得大奖！

要知道距离上面一个史密斯吃面条到如今，也才短短两年，前后两个视频内容已经是天壤之别的区别！

一年一个重磅消已经不够用了，几乎每个月都有新东西冒出来！

然后就是这次的GPT-image-2。

之前我用过不少AI生图工具，有时候生成带文字的图片都气得想砸键盘。

连“生日快乐”这种简单的词都能扭曲成“生曰快东”，更别说很多字的中文海报了，简直没法看。

经常花数小时生成，挑选几张能用的，或者手动ps修正错误。

但GPT-image-2直接把文字准确率从前代的90-95%拉到99%。

什么概念？

实测生成的餐厅菜单从店名到价格都清晰可辨，打印出来足以以假乱真。

作为电商行业的，我看到的那一刻，脑子里冒出来的第一个念头是：这东西可以直接做电商详情页了吧？

以前做详情页，文案要反复核对，字体要调整，排版要改来改去。现在给个描述，几秒钟就给你生成一版——2K分辨率起步。

印刷厂无需再筛选可用图片，电商运营可以告别美工修图，自媒体博主能省下图库会员费。最离谱的是它的“Thinking模式”。接到任务后会先思考、规划构图，必要时联网搜索实时信息，生成后还会自我复核，能一次生成八张风格一致的图片。

这个细节真的挺吓人，太强了！我朋友做设计的，都感慨差不多都要失业了。

要知道之前都说ai感，但是现在这些图片，真的一点违和感都没有，那些细节的小字，也都完全没有错误！

以后电商运营是不是只需要会打字就行了？

技术是实打实地在进步，这个不得不服。

但不得不吐槽，有些人吃相确实难看。不是技术不好，就是付费方式让人想骂人。

某视频生成模型，一开始注册给一万多积分，大家用得挺爽，动不动就在群里晒自己生成的“大片”。

可随着用户量激增，算力成了最稀缺的资源。

为了缓解算力压力，开始频繁调整策略——积分越来越少，消耗越来越高。

最骚的操作是：高级会员的积分从15000砍到6160，积分消耗从45涨到90，还搞出VIP专属通道，插队要花210积分，这不就是在VIP头上再叠一个VIP嘛。

前两年看AI发展，像是挤牙膏，每次更新都是小幅优化。现在呢？几个月就一个重磅，每次出来都让人觉得“卧槽这也行”。

从“史密斯吃意大利面”都生成不了，到GPT-image-2的以假乱真。

设计行业怕是真要洗牌了，影视行业可能也是。还有音乐——AI作曲已经能写完整的交响乐了，虽然有人说“没有灵魂”，但“够用”级别的作品不需要等灵感了。

有人说AI热潮和当年互联网泡沫一样，最终会一地鸡毛。

我不认同，互联网当年确实泡沫破灭过，但活下来的那批公司，彻底改变了世界。AI现在也是，技术本身已经以肉眼可见的速度进化。