只用了一句话,AI做出了建模软件截图、还有完整汇报方案 | GPT-image-2
最新的 GPT-image-2,各位用了不?在生图这一块,提升是相当猛。
跟你说,现在铺天盖地的AI宣传,我最烦的就是一个词——「震惊」,天天震惊,有那么多好震惊的吗?
这么说吧,最烦「震惊体」的我,这会儿给你写这篇文章,脑子里除了震惊,还真想不到什么别的更好的词儿。
最让我跌眼镜的,是它现在居然可以用这么短的提示词,干这么多的活儿。
这么一张图,平淡无奇的Revit界面跟模型,对吧?
我要是告诉你,这张图是AI生成的,你可能觉得不可思议。
可它确实不是软件截图,每个按钮、每个模型、每一条线,都是AI生成的,不信你放大看看,软件局部还是有些BUG的。
我把图发到进步会员群里,有小伙伴就来问,什么样的提示词可以生成这么复杂的图片呢?
诺,我的提示词,就下面这一句,我不需要告诉他什么是 Revit,复杂建筑和管线是什么意思,一句话,生成一张图。
这只是个开始,接下来跟你唠唠,从昨天早晨到现在,让我一直没合上嘴的GPT-image-2。
其他什么电商母婴行业咱不提,看看在建筑业,现在它到底能不能帮咱们出一些活儿?
最常见的,文生图、图生图,比如给它一张建筑草图,它来生成一张渲染图,这些咱们不陌生,来,直接上点难度。
我给了他一张画在餐巾纸上的草图,只给了他两条线索:这是个现代美术馆,正面有图书书架的设计元素。
注意,我不是让它生成单张渲染图,而是要让它再没有任何信息输入的情况下,做一个完整的方案汇报图,来看看成果:
我盯着这张图看了半天,愣是没挑出什么毛病来,尤其是这些中文,从字体到内容到排版,真的很完美。
我突然想起刚才制作 Revit 项目成果的那张图,想试试看能不能就基于这个项目,帮我再做一张Rhino的图。
不仅 Rhino的软件界面给做出来了,项目看着也是那么回事儿,它居然还像模像样做了个Grasshopper的节点图在里头。
当然了,对于老设计师来说,正经当成项目图,那肯定是不够使,还是有BUG的。
但你想象,要是第二天就要上台演讲了,临时把几张这样的截图,扔进一份汇报的PPT,在演讲现场,能有几个人看出是AI生成的呢?
聊到汇报,我就突然想到那张 BIM 行业万年不变的图,实在是有点太老了,于是就扔给image2,让他帮我重新设计,要求就是现代化、有科技感。
你看,还是短短的几个关键词,就把这图重焕新生了,而且在没有额外要求的情况下,它根据自己的理解,加入了很多文本,而且还说得挺好(PS:你要是不嫌弃,这图尽管拿去用)。
到这儿,我似乎有一点点感觉,之所以可以通过极少量的提示词完成还不错的结果,背后重要的原因就是,image2知道的事儿比我们想象中要多。
我找了一张园区厂房的总平图扔给了 image2,提示词依然很短:「帮我根据这张平面布置图,生成一张真实风格的鸟瞰图,要加上方案设计的文字,形成一个完整的汇报方案图」。
让我吃惊的不只是这个方案图有多么像回事,还有它对世界知识的理解。
所谓世界知识,就是我没有告诉他的信息,但他会根据一些常识知道该去做什么。
比如我给的这张平面图,上面的 5 个都是厂房,那么在它的理解中,就要做成单层建筑;而下面的办公楼和宿舍楼都是多层建筑,于是它就把高度给拔了起来。
再看下面这个,我只是告诉它这是一个老旧小区的楼,让它帮我生成一个现代小区的老旧建筑改造方案。
这里的世界知识又起作用了,它需要知道「老旧建筑改造」意味着什么,不仅有传统的安全提升、品质改善、设施更新,还得有最近主流的节能降耗、绿色智慧,做了新的效果图就不用提了,连汇报风格的主题色都是绿色。这一切都不是我给的提示词。
咱们干机电的小伙伴,很少在方案美学上加以考虑。这次我就让它生成一套机电管线避让逻辑示意,带有专业标注、逻辑清晰的3D轴测分解图。
出来的方案比建模软件截图漂亮多了,它还考虑加入了避让逻辑和原则、符合ISO 19650标准的设计流程。
下面这个图,只有左上角的原始工地航拍图是我给的参考图,我让它基于这个工地,帮我做一份施工场地布置方案。
其实厂部方案我还是挺外行的,布置哪些内容只知道个大概,于是也就没有多提需求。
在它给出的方案里,我至少看到了物资动线、消防防火、施工道路环通,临时建筑、塔吊、物料堆、宿舍、库房、砌体材料、建筑垃圾堆放区、食堂、堆场围挡、防雨覆盖、标识牌等等,对于我一个场布的外行来说,挺唬人了。
前面那些图,如果放大仔细看,我猜多少是能挑出来一些毛病的。
但别忘了,前面我们一直是在测试,极少量的提示词,能做出什么样的效果来。
如果有不达标的地方,肯定是他猜得不够「准」。想让它更符合要求,你可以接着追加提示词。
比如我想到前阵子起航跟我说,看到淘宝上有一种奇特的店铺生态,专门给工地P图,几十块钱一张,应付各种审查的。
我就想,要是把image2用得「邪修」一点儿,是不是未来能把这些店铺的老板给替代了?
第一次弄出来的图,管道是有了,但有点……太新了,这肯定不如人家淘宝店做的好,领导一眼就能看出来是假的。
没事儿,咱们补充提示词,让它把管道做旧,最好在上面蒙上半层土,再看看结果。
再比如,下面这种项目,竟敢不做施工安全围挡,这不等着罚款?
原图扔给image2,这次加上了比较复杂的提示词,包括参建单位、负责人,甚至还有负责人的电话,它都能老老实实地给放到安全围挡上面(真敢写单位和手机号,吓得我赶紧手动打码)。
说回正途,对于一个智慧工地+数字孪生的大屏设计人员来说,给甲方出一版前端方案,大概要多久?
下面这个图,我的初始提示词是很短的一句话:模拟一张带有UI的建筑科技大屏界面,这是它出的第一张图,一共花了2分钟。
甲方肯定会提意见,比如「要把分页在左侧竖排,左侧是真实工地监控,要分成多个视角可切换,右侧是BIM孪生模型,甲方看腻了蓝色风格,换一个灰色的」,于是2分钟之后,你就能得到这张图:
对方可能还是觉得不够大气,那你就再加些提示词,比如:「更有现代感的深灰色背景、多一些留白,不要太紧凑,数据更详细,要有甲方LOGO的绿色元素。」
我不知道这对以做图为主的设计师来说,是好事还是坏事,总之,我觉得某种工作的范式确实改变了。
到这里,你可能对image2的能力,有个大概的体会了。
也有可能,你会想,用它做个建筑设计方案,明眼人还是能仔细辨别,查出来是AI做的。
我们不去争辩会有多少人仔细放大看,也不随便揣测再过几个月AI能不能做到更牛逼的以假乱真。
我们只看发生在现在的事儿,马上就能实操的事儿,也已经有大量的工作,可以被AI改变。
下面这个提示词,就是简单的一句话,要求也是非常粗略的「有设计感、简约、与建筑科技相关。」接着,我直接复制粘贴了进步圈子招聘的一期内容,大概有一千多字。
然后,一张排版漂亮的招聘海报,就做出来了。它不仅把我给的上千字做了提炼和总结,还把重点都给放到最大最显眼的位置。
更离谱的是,我完全没告诉它该做成什么颜色主题,只因为我发给它的熊仔微信二维码,中间有一个小小的LOGO,是青色的,它就根据这一丢丢青色,设计出了整张海报的风格。
顺带一提,这个招聘信息是真实的,它确实来自进步社群招聘第281期,你确实可以扫码联系熊仔咨询。
我听了很多人说,AI 终归到底还是干活的工具,最终要对审美负责的,还是人。
测试的最后,我给他发了一个进步社群的宣传文档,里面有大几千字,也没有很好地提炼重点,而且这次我没有对它提什么风格的要求,就说自己根据内容自己做决定,然后丢了一个二维码给它。
对于它发给我的最后一张图,我的评价是:重点构突出,排版够整洁,风格够大气。
再顺带一提,这个关于社群价值的海报,信息也是真实的、可以扫的。你觉得,从零做出这个程度的海报,需要多久?
如果你非要问我,这个图的审美可不可以再提高一些?我想,努努力或许可以。
但这是我没有提什么要求,甚至没花什么力气去想该怎么提要求,就做出来的一张图。
我觉得,这不是「要啥自行车」的问题,这就是一辆非常、非常厉害的自行车。
写完这篇评测,正好看到卡兹克也测了image2,他最后写了一段话给设计师:
但设计师的时代,才刚刚开始。这个世界永远不缺画图的工具。
但永远需要的,是真正的思考者、创造者、和问题的解决者。
以前我们有一个借口,把大量精力浪费在如何把一张图做出来。
现在你可以说,AI把我们从「做图」的杂务里解放出来,重新回到「这张图解决什么问题」的思考本身。
当然,也可以换个说法:我们被AI逼着,从「做图」这件安全的事儿里退出来,重新定义自己的价值。