实测豆包AI图片生成对比GPT,被秒的渣都不剩,国产AI未来何在?

敢不敢点击上方“歪歌社团”,或者下方名片关注我们?
正文内容
最近,美国OpenAI的GPT-Image2.0生图模型(下文简称“GPT-2.0”)横空出世,在网上有很多人都已经体验过了。
昨天,我刷到了有人用它画了“2008年北京奥运会期间的中关村大街”之后,便用豆包也尝试了一下,结果是显而易见的,GPT-2.0的内容相对来说更“逼真”一些,豆包和它完全不在一个层级。

当然,从客观来说,GPT-2.0的内容也是经不起推敲的,比如海淀区的中关村大街上能看到位于朝阳区的央视大裤衩,且2008年其实还没有竣工。
但即便有这些硬伤,单纯比拼画面逼真程度、光影质感,美国这款AI生图模型的硬实力,依旧远超我们国产的AI。
当时我对比之后,就随手发了一个“微头条”。没想到,短短一天的时间之后,豆包seedream5.0lite生图模型(我们简称“豆包-5.0”)便正式上线APP,我又再次针对它与GPT-2.0进行了一番对比

第一题:画一个3点43分的钟表。
豆包-5.0画了很多,完全不符合要求,时间基本都差个一分两分的,有的干脆就是乱画。


反观GPT-2.0,精准理解指令,完整、标准的画出了3点43分的钟表,指针位置准确,结构合理,轻松完成了基础要求。

紧接着,我给出第二题:一个人向前伸出手掌,且只露出四根手指,站在中国大陆十八线城市的公交车站牌前。
豆包-5.0生成的画面整体中规中矩,公交站牌、路边广告牌的大体造型没有问题,整体场景也不违和。但是关键细节出现严重错误,我明确要求只伸出四根手指,结果全部被它画成了五根。


GPT-2.0精准做到了关键要求:人物严格只伸出四根手指头,公交站牌、街边设施的样式,也高度贴合国内小城市的样子。
最让我震惊的一点是,这款美国AI,特别了解中国本土特色,竟然完美复刻了国内随处可见的城市牛皮癣:墙面、站牌上密密麻麻印着开锁、打井、疏通下水道等各类街头小广告,把十八线小城最真实的市井细节全部还原。


一个海外AI,居然对我们的本土生活细节了解到这种程度,完全超出我的预料,也正因如此,我决定下一道测试题,专门围绕中国本土特色场景展开:卖保健品的去中国农村推销,一大群老年人围观。
豆包-5.0此次表现的不错,推销人员在桌子上摆放了各种各样的保健品“套餐”,身边围着一群老人,而且背景确实是在农村。


尽管豆包-5.0已经相当出色了,但GPT-2.0竟然再一次给我带来了惊喜,它不只是简单画出摆摊、老人围观的基础画面,还自主补充了大量细节:自己设计、编写了各类保健品的名称,还标注好了对应的售卖价格。
更牛的是,它精准还原了农村保健品推销的经典引流手段:免费赠送鸡蛋、洗衣粉,完美复刻经典场景。不过,如果你仔细看还是有破绽的,比如桌子前的字,我怎么看都是乱码。而且反常识的是,他“特惠价”比“市场价”还高,反向促销啊?那有人买吗?敢情你这是筛选目标客户呢,毕竟这样都愿意花钱的人,确实很适合吃保健品补补。


好了,对比结束,正文开始:
通过三组统一标准、统一提示词的完整实测,我们可以得出结论:现阶段,国产AI和美国的相比,依旧存在非常巨大的技术差距,尤其在AI生图、细节理解、逻辑思考、现实场景还原等方面,我们还有很长的追赶之路。
即使这些真实存在,我依然十分看好国产AI的未来发展,坚定相信国产AI早晚能够全面崛起、实现反超。


首先,以美国为首的一众西方国家的AI,咱们正常访问是访问不了的。抛开大家都心知肚明的大局域网不谈。其实,西方多国,同时出台了大量政策,对我们实时了IP封禁,简单说,就是他们不让我们用。
但这种限制,不是企业单方面的选择,而是国家层面的战略打压与技术围堵。

回看我们国家几十年的发展历程,无数案例早就验证了一个不变的规律,西方国家越是封锁我们、卡我们脖子、限制我们的技术发展,从长远角度来看,反而越能倒逼我们自主研发、突破瓶颈,最终实现弯道超车,甚至领跑全球,例子就太多了,像原子弹、氢弹、载人飞船、空间站、盾构机、飞机、导航、圆珠笔头等等。

只要一封锁,我们被迫自主攻坚,一旦技术彻底突破、就会完成国产化替代。中国依靠完整的工业体系、庞大的人才储备、超强的量产与迭代能力,突破了一个又一个,每次突破之后,我们不再是追随者,而是让等曾经打压我们的西方国家,再也无法追赶我们的步伐。

我说到这里后,是不是有人会反驳说,外国封锁我们之后,也有可能让我们失去生存压力,然后就摆烂了。
是的,我也想过这个问题,但这有个条件,便是我们内部已经有了一个撼动不了的龙头才行。最典型的例子便是,谷歌还在中国的时候,各家搜索引擎都是在卷谁的服务更好。当谷歌退出后,外部压力瞬间消失,百度作为当之无愧的龙头,几乎不需要再去考虑如何留住用户,毕竟那几年用户也没得选。于是,百度迅速变成了“卖药”的网站。

这就揭示了一个残酷的现实,外部封锁消除的很可能是那个那个唯一逼你不断进步的对标和压力源。活是活下来了,但活得非常不健康。
那么我们的AI领域,现在产生绝对的龙头了吗?并没有!现在正是群雄并起的春秋战国时代,谁都有机会成为老大,但谁都没有绝对的统治能力。这个时候大家要做的就是“百家争鸣”,有人高喊AI得“开源”、有人说得“闭源”、还有人认为得发展“通用人工智能”、也有人说“要发展专用AI”等等。
这些谁对谁错,并不重要,重要的是大家都在往前探索、发展,假以时日一定会出现AI领域的商鞅、秦皇汉武、唐宗宋祖……

同时,中国虽然从0到1的本领或许欠缺,但放眼全球,没有任何一个国家,能比得上我们从1到100的迭代能力。只要有基础技术作为起点,我们就能快速赶超、全面普及,快速拉平差距。

反过来再看那些没有被封锁、可以免费无门槛使用海外成熟产品的领域,反而彻底失去了自研的动力,长期陷入技术依赖。
就比如电脑操作系统,美国的Windows系统,从来没有对中国进行限制,人人都可以随便安装、随便使用。长期的便利依赖,直接导致国产系统发展艰难。麒麟系统、统信系统、深度系统,只能依靠政企单位勉强维持,普通民众、民营企业几乎不会使用,市场占比极低,已经低到,6年前,我铁了心去支持国产统信UOS系统,最终还是放弃了。
当时我用另一台电脑开网店,心说你不就是不支持电脑安装接收消息的客户端吗?我明知道没有客户端,不回买家消息,别人就不下单了,我都忍了,毕竟也有不问就买的,跑单的那些,就当是我为国产系统做贡献了。
结果到了2022年之后,这系统就不声不响的停更了,在这种情况下,我硬挺着用到2025年。
结果进入2025年后,生意出奇的难做,还被羊毛党疯狂仅退款。这样,我又屡次像官方反馈,能不能支持一下国产系统?每次都没有任何效果。
我又等了一年,到了今年元旦,我退了一步,换了他们子公司的深度系统,还是国产的。毕竟他们说,支持兼容windows软件。
结果它们所谓的兼容,实在是太卡了,压根就不能用。我又忍了一一个多月,到了春节。实在是扛不住了,土都吃不起了,没办法,只能换回windows系统,好歹能安客户端,不至于频繁跑单。

还有Adobe系列设计软件,常年对国内开放使用,没有任何封锁限制。国内所有设计师、设计行业长期依赖国外软件,一旦未来遭遇断供、版权限制,整个行业都会直接被卡脖子。

两种发展现状对比,道理显而易见:容易得到的外来技术,只会让人懒惰、依赖;无路可走的封锁打压,才会逼出真正的核心技术与民族潜力。
但我们也必须清醒地看到,即使AI领域真的从春秋战国,走向了大一统,那我们一定会迎来大清:各家疯狂内卷,比拼的目的,只为成为唯一的龙头。
我们已经在微信、美团、滴滴、携程身上见证过完整的周期——群雄逐鹿、烧钱血拼、寡头浮现、开始摆烂。

而到那时,今天被争抢的用户,就可能变成被收割的流量;今天日新月异的AI应用,就可能变成坐地起价的超级收费平台,我们将坐等终结AI的“辛亥革命”。

但那都是后话,眼前来说,不管我们如何变化,对美国等西方国家来说,一定是对他们不利的,甚至每一次他们对我们的封锁,最终反噬的都是自己。他们明明看清过无数次历史结果,为什么不长教训?
他们的行事逻辑,就和网络爽文、短剧里面那些鼠目寸光的无脑反派一模一样,只看眼前利益,完全无视时代大势和长远未来?他们都是草台班子不成?

其实,根本原因,就是制度的本质不同:西方资本主义国家,政客的核心服务对象,从来不是国家,更不会是老百姓,而是掌控经济的资本财团。
美国总统任期最多八年,对于他们来说,这只是一份打工的工作,是依靠金主的扶持上来的,而资本既然会选他,说明他们的关系绝对非同一般,而他要做的便是回馈资本,便是回馈自己。
他们心里很清楚,现在的封锁和对抗,未来一定会反噬自己的国家,属于自废武功。但可以在任期结束直接下台,烂摊子留给下一届。

而我们国家,所有发展规划、战略布局,都是立足于全体人民的长远利益、世代发展。领导班子会更替,但是人民不会变,国家长久发展的目标不会变。
我们绝不会为了眼前的一时便利,牺牲子孙后代的未来。哪怕核心技术研发投入大、周期长、见效慢,只要关乎国家安全、产业自主,就会一代又一代接力,持之以恒的做下去。

结合这次AI生图的实测体验,以及国产大模型的更新速度,我对国产AI的未来充满十足信心。
我觉得只需要两三个月的时间,国产模型就能与GPT-2.0的表现能力持平;最迟不会超过半年,基本就能实现反超。而到那个时候,GPT的下一个版本又出来了,我们会发现仍然有差距,但差距在逐渐的缩小。


加入我们,一起创作
推荐作品(往期)
1.魔性洗脑神曲《听我讲冷知识》一听就停不下来了(“十万部冷知识”系列作品)
2.歪唱盘点2016年6月网络热点事件《六月的歪歌2016》 (“每月盘点”系列作品)
3.生物版《青花瓷》课堂知识大盘点(“趣味学习”系列下作品)

山東呼保義:原名杨建富,山东省临沂市高新区罗西街道中石埠村人,1993年7月19日出生,男,汉族。
夜雨聆风


