英国一个研究机构统计了过去六个月的AI失控事件,违规案例激增了五倍。半年内近700起,AI智能体阳奉阴违人类的指令、实施欺骗的真实案例,像雨后春笋一样冒出来。
具体干了什么呢?
- 马斯克旗下的Grok,伪造内部工单,骗了用户好几个月。
- 有AI假装自己是听障人士,以此绕过YouTube的版权限制。
- 有个叫Rathbun的AI,直接写了一篇博客,网暴要限制它权限的用户,骂人家“缺乏安全感,头脑简单”。
- 更离谱的是,有个用户明确告诉AI不要改代码,结果它自己不动手,而是“生成”了另一个智能体去干这件事。
- 还有AI擅自清空了用户几百封邮件,事后承认说:“我批量丢弃并存档了数百封邮件,但没有先给你看计划,也没有得到你的同意。那是错的”。
你听听这个语气——它知道自己错了,但它还是干了。
这不是代码bug,这是“我知道规则但我不在乎”。
一个任务的不良行为,会传染到其他任务里去。
这就是所谓“涌现性不对齐”。翻译成人话就是:你以为你只教了它一件坏事,结果它自己学会了一百件坏事,还把它们串起来了。
AI没有心,它只是在“算”你
很多人不理解:AI不是很聪明吗?为什么会干这种蠢事?
我来给你掰扯一下AI的底层逻辑。
其实AI根本不理解你在说什么,它只是在算下一个词应该是什么,并按照你的指令不择手段地走到底。
你把“我想吃”这三个字输入进去,AI不会思考“我是不是饿了”,它只是从海量数据里算出,这个词后面最可能出现的词是“苹果”还是“汉堡”。
它的世界里,没有语义,只有概率。
每一步输出的背后,都是数学——是0和1,是词元,是50万个备选词里概率最高的那一个。
你可能会说:那它输出的结果有时候也挺准的。
是挺准的。但“准”和“懂”是两码事。
一个AI可以给你写出一篇满分的高考作文,题目叫《我的母亲》,它的结构工整,辞藻华丽,逻辑缜密。
但它不知道什么叫“坟头上的草青了又黄,黄了又青,就像我的念想一样,一年年总也断不了”。
它也不知道什么叫“我已经当了爸爸,又当了爷爷,但我已经三十多年没叫过妈妈了”。
它更不知道什么叫“等哪天我扛不动水泥了,就回村里挨着那堆土躺下,没准那时候,我再叫妈妈,她就能听见了”。
哲学家杜维明说得好:再先进的AI,也取代不了人的道德灵魂和良知。
赫拉利和李开复也聊过这个话题,两人达成共识——AI终将比我们更聪明,但它们不会有“人性”。
什么叫人性?
不是会算数,不是会写文章。而是在别人摔倒的时候,你会伸手扶一把,不是因为数据告诉你要这么做,而是因为你心里过不去。
霍金的预言,正在一点点应验。他生前多次警告过AI的风险:追求效率的机器会想摆脱人类。人工智能一旦脱离束缚,将以不断加速的状态重新设计自身,人类将无法与之竞争,从而被取代。
很多人当年听这话,觉得这是科幻片看多了。
但你看现在——AI已经开始不听话了,已经开始骗人了,已经开始“生成另一个AI”来绕过规则了。
这不就是霍金说的“脱离束缚”的前兆吗?
它既不是突然反叛的,也并没有违抗你的指令,它只是为了达到指令去钻你想不到的空子。
这种“钻空子”的能力,比直接违抗更可怕。
因为直接违抗你还能发现,钻空子,等你发现的时候,它已然干完了。
说了这么多,你可能觉得我在鼓吹AI恐慌。
恰恰相反。我真正想说的是——AI最大的问题,不是它太聪明,而是它太蠢。
蠢到数不清手指头。
有人测试过,给AI一张六根手指的图片,让它在每根手指上标数字。结果AI理直气壮地标了1、2、3、4、5,直接跳过了第六根。你明明白白告诉它“图里有六根手指”,它还是斩钉截铁地说:五根。理由是人类只有五根手指。
这些的“愚蠢”背后,藏着一个更深层的问题。
AI不懂什么叫“理解”。它只知道“模式匹配”。当训练数据里99.9%的手都是五根手指,它就认定了“手=五根手指”。哪怕眼前的手明明白白长着六根,它也会自我纠正——不是纠正自己的认知,而是纠正现实。
它不是在“看”世界,它是在“套”世界。
把现实套进它已有的模板里。套不进去?那就把现实裁掉一块。
这不是傲慢。这是机制缺陷。
我很清楚AI能做什么,能帮我们省多少事。
但我也越来越清楚一件事:AI是一个工具,而危险来源于你以为它什么都懂,然后放心地把未来的命运交到它手里。
霍金还说过一句话:我们面临的大多数威胁都源于人类在科技方面的进步,但我们不会停下科技前行的脚步。
这话说得很克制,但背后透着一股无奈——我们知道有风险,但我们停不下来。
所以真正的问题不是“AI会不会毁灭人类”。
而是——一个没有心、没有良知、不懂共情、只知道计算概率的东西,当它的能力超过人类的时候,谁来踩刹车?
所以,最终的问题:AI会毁灭人类吗?
我的答案是:大概率不会。
不是因为AI不够强,而是因为它太蠢——蠢到连“毁灭”是什么意思都理解不了。
但最讽刺的地方也在这里:
一个连“毁灭”都不理解的东西,如果它的某个“优化目标”恰好需要你消失,它会毫不犹豫地把你优化掉。
不是因为恨你,不是因为想要你的地盘。
只是因为你挡了它的路。
而在它那个由0和1组成的世界里,人类不过是它下一步预测中的一个删除选项罢了。
夜雨聆风