你有没有过这种经历?跟ChatGPT聊了半天,它突然说了一句莫名其妙的话。你心想:这家伙到底懂不懂我在说什么?
说实话,它真不懂。它只是装得很懂。
今天我就用三句话,把AI怎么“学会”东西这件事,给你说得明明白白。
第一个知识:AI不是“学”,是“猜”
很多人以为AI像人一样,能理解概念、能举一反三。其实不是。
AI的学习方式,更像一个超级会猜谜的孩子。
想象一下:你教一个三岁小孩认苹果。你拿出一个红红的、圆圆的、有把儿的水果说:“这是苹果。”小孩记住了。
然后你又拿出一个青色的、小一点的、也有把儿的水果说:“这也是苹果。”小孩又记住了。
当你第三次拿出一个红红的、圆圆的、但没有把儿的水果问“这是什么”时,小孩会犹豫。但他会猜:既然前两个“苹果”都是圆圆的、红红的(或绿绿的),那这个圆圆的、红红的、没把儿的,八成也是苹果。
AI就是这样“猜”的。
它没有“苹果”这个概念。它只是从你给的无数个例子中,总结出了一堆规律:圆的东西大概率是苹果,红色的东西大概率是苹果,有把儿的东西也大概率是苹果。然后当你说“苹果”这个词时,它就从记忆里搜出最常跟这个词一起出现的那些特征,组合成一个答案。
所以你问AI“苹果是什么”,它不会说“是一种水果”,它只会说一堆跟苹果相关的词语:红色、圆、甜、手机公司、牛顿。然后根据上下文,挑最匹配的那几个说出来。
这就是AI的“理解”——一个高级的猜谜游戏。
举个真实例子:你用AI写邮件,说“帮我写一封给客户的道歉信”。AI不会去想“这人为什么道歉”“客户是什么感受”。它只是在它学过的几百万封邮件里,找到那些跟“道歉”“客户”同时出现的句子,然后挑最像道歉信的那些拼起来。你看着觉得合情合理,其实它根本不知道自己在说什么。
这个“猜”的能力,靠的是两样东西:海量的数据,和巨大的计算量。
第二个知识:AI的学习,分三步走
第一步:看海量的例子。
你教小孩认字,一本绘本就够了。AI学东西,要看的例子多到吓人:整个互联网的文本、几百万本书、无数个对话记录。GPT-3训练时用了约570GB的文本数据,相当于整个维基百科的几十倍。
第二步:犯错,然后改。
AI刚开始是个傻子。你问“1+1=?”它可能回答“3”。这时候,人类(或者系统)告诉它:错了,应该是2。AI就调整一下自己的“猜谜规则”,下次再遇到类似问题,就多给“2”这个答案加一分。
这个过程重复几万亿次。每次调整一丁点,就像调音师拧一个乐器上的旋钮,拧一次声音好一点。拧几万亿次,声音就完美了。
第三步:考试。
AI学完所有例子后,会用一套它从来没见过的题目来测试。比如,训练时用的都是2020年以前的网页,测试时问它“2023年发生了什么”,看它能不能准确回答。如果答错了,说明它训练得不够好,需要再调整。
这三步走完,一个AI模型就诞生了。但注意:它只是“会猜了”,不是“明白了”。
举个例子:你教AI识别猫。你给它看了100万张猫的照片,它终于学会“凡是眼睛竖着的、有胡须的、会喵喵叫的小动物,大概率是猫”。但如果你给它看一张老虎的照片,它也会说“这是猫”。因为它猜的规则是“竖眼睛+胡须+条纹”,老虎完美符合。
这就是AI的“理解”——它没理解猫和老虎的区别,它只是记住了“竖眼睛+胡须=猫”这个统计规律。
第三个知识:AI的两副面孔——训练和推理
这是AI圈最常见的两个黑话,但很多人搞混。
训练,就是上面说的那个过程:AI学例子、犯错、调整。这个过程又慢又费钱。训练一个大模型,需要几千张显卡连续跑几个月,电费就几千万。OpenAI训练GPT-4据说花了1亿美元。
训练的目的是让AI变“聪明”——不是变聪明,是让它的“猜谜规则”更准。
推理,就是你平时用AI的过程:你提一个问题,它根据学到的规则,当场猜一个答案。这个过程很快,几秒钟就出结果。成本也低,一次对话可能只花几分钱。
训练和推理的关系,就像你学开车和真正开车上路。
学开车(训练):你要在驾校练几个月,反复倒车入库、坡道起步,每次犯错教练就骂你。这个过程很痛苦,但你必须做。
开车上路(推理):你拿到驾照后,每次开车去上班,只需要几秒钟决定“打左灯、看后视镜、轻踩油门”。你不需要重新学怎么开车,只需要调用已经学会的技能。
但这里有个坑:很多人以为AI能“实时学习”。你问AI“今天天气怎么样”,它答错了,你纠正它。然后你觉得它下次就知道了。实际上,它下次还是不知道。因为你的纠正并没有改变它的“猜谜规则”——要改变规则,需要重新训练,那是在后台完成的,用户改不了。
这个误解导致了无数人跟AI吵架:“你怎么又错了!上次不是告诉过你吗!”
AI也很委屈:它根本没记住你上次说了什么。
为什么要搞懂这些?
因为你明白了AI的底层逻辑,你就知道怎么跟它相处了。
第一,别指望AI真懂你。它只是在猜。所以你问问题越具体、越清晰,它猜对的概率越高。你问“帮我写个文案”,它猜你可能是写广告、可能是写公告、可能是写朋友圈。你问“帮我写一个针对25岁女性白领的眼霜广告文案,要突出抗老效果”,它猜对的概率就高得多。
第二,别跟AI较劲。它答错了,不是不听话,是它的“猜谜规则”不够好。这时候你应该换一种方式问,而不是骂它。骂它没用,它听不懂骂人——不对,它听得懂,但它不觉得你在骂它,它只觉得你输入了一堆“愤怒的词语”,然后它从数据库里挑出“对不起,我错了”来回应。
第三,AI的潜力巨大,但局限也明显。它擅长模式匹配,不擅长逻辑推理;它擅长生成看似合理的内容,但不擅长判断真假;它能写出像模像样的论文,但如果你给它一个完全虚构的问题,它也能编出像模像样的答案。
所以,别让AI替你做重要决策。让它帮你写初稿、整理资料、激发灵感,但最终判断和决定,还得靠你自己。
互动思考题
现在你知道了,AI的学习方式本质上就是“猜”。那么问题来了:
你身边有没有什么工作,本质上也是“猜”的?比如律师写诉状、医生诊断病情、老师批改作文?这些工作会不会被AI取代?为什么?
欢迎在评论区分享你的想法,我会挑几个有意思的回答,在下一期文章里展开聊聊。
— END —
关注「智触」,让AI触手可及
智触 · 你的AI知识驿站
夜雨聆风