中老年人学AI:什么是"多模态AI",有哪些免费工具
很多朋友留言问我:这个多模态AI是什么,有哪些App可以用。
一、一句话讲明白:什么是多模态AI?
它什么都能看懂——你给它文字它懂,给它图片它懂,给它语音它也懂,还能把这些东西揉在一起干活。
你给多模态AI一张手机截图,跟它说:”帮我把这段文字提取出来,然后给我写一份工作总结”。
它能看懂截图里的文字,还能理解你说的话,直接给你写好工作总结——这就是多模态AI能干的活。
放在以前,你得先自己把文字从截图里抠出来,再复制给AI写,现在一步到位。
二、多模态AI到底能帮我们的五个真实场景
说了这么多,到底跟我们有啥关系?我给你整理五个普通人每天都能用得上的场景:
1️⃣截图问问题,不用自己打字
放在以前,你得自己把截图上的文字一个字一个字打出来,再发给AI。
现在有了多模态AI,你直接把截图发过去,说清楚你想问什么,它直接给你答案——省了你多少打字时间。
2️⃣照片讲一讲,这是什么地方/什么东西
出去旅游,看见一朵奇怪的花,不知道叫什么,掏出手机拍一张照片,发给多模态AI:”这是什么花?”,它直接告诉你。
看见一个老物件,爷爷奶奶留下的,不知道干什么用,拍一张照片,AI直接给你讲清楚历史。
甚至你去外面吃饭,菜单字太小,拍一张照片发给AI:”帮我推荐两个这里的招牌菜”,它看完菜单直接给你建议。
3️⃣语音+文字+图片,一起给你写文章/做PPT
-
脑子里有个想法,零零散散记在几张照片上,还有几段语音
-
多模态AI能把这些东西都合在一起,你说”帮我把这些整理成一篇完整的文章”,它直接给你整理好。
做PPT也是一样,你把想放的图片都发过去,说清楚大概内容,它帮你把文字都写好,你直接拿去排版就行。
4️⃣帮你修图改图,不用学PS
你想给这张照片换个背景,想把照片里某个人P掉,以前得学PS,现在多模态AI你直接说:
“帮我把这张照片背景换成海边”,”帮我把这个人从照片里去掉”,说完它直接给你改好。
5️⃣视频截图,帮你把视频内容整理成文字
看一段视频,想把里面干货整理出来,不用自己一边看一边记。截几个关键帧图发给多模态AI,它就能帮你把内容整理成文字提纲。
当然,现在最好还是你把视频转成文字一起给它,准确率更高,但它确实能帮你省很多事。
三、免费的多模态AI工具
说了这么多,哪里有能用的多模态AI?我给你整理几个普通人直接就能用的,不用折腾:
四、最后说两句:多模态AI到底带来了什么变化?
很多人一听”多模态”这三个字,觉得肯定是高大上的技术,跟我们没关系。其实不是,多模态AI最大的好处,就是让AI用起来更像人,更方便了。
简单说:以前AI是你要适应它,现在它开始适应你了。
你不用管它技术到底怎么实现的,你就记住:现在AI能看懂你给它的图片了,能看懂你给它的语音了,能帮你省好多打字整理的时间,这就够了。
欢迎关注我,活到老学到老,一起探索AI的各种可能。