乐于分享
好东西不私藏

AI不是大力丸

AI不是大力丸

这本书的两位作者都来自普林斯顿大学。第一作者阿尔文德·纳拉亚南是计算机科学教授,常年研究AI等数字技术对社会的影响;另一位是他的博士生。

书名的英文《AI SNAKE OIL》原意是“AI蛇油”。19世纪末的美国,江湖游医四处兜售一种号称“包治百病”的“蛇油”。实际上,这些药油几乎不含任何有效成分,甚至有害健康。

作者借用这个概念,想说的是:今天许多被吹得神乎其神的AI技术,其实就是当年的“蛇油”——名声在外,但实际效果与宣传相去甚远,甚至潜藏着风险。

AI万金油的翻译还差点意思,如果翻译成《AI大力丸》可能更精确:在现今AI产业的叙事中,我们是不是在被许诺一种“立竿见影”的技术奇迹?而且,“大力出奇迹”本就是互联网常用梗,契合AI行业“算力至上”“蛮力堆叠”的底层逻辑——讽刺意味更当代、更精准。

第一部分:两种AI,两套问题

在深入之前,先明确两个概念:

  • 预测式AI:核心任务是“做判断”。人脸识别(这张脸是谁?)、垃圾邮件过滤(这是垃圾邮件吗?)、医疗影像诊断(这个结节是良性还是恶性?)。这里的“预测”不限于“预知未来”,而是泛指“做判断、下结论”。
  • 生成式AI:核心任务是“搞创作”。ChatGPT、文生图、文生视频——输出我们能理解、能欣赏的文字、图片、视频。

两类AI,各有各的问题。

第二部分:预测式AI的三大“暗礁”

第一重:可预见的局限——为什么有的AI怎么训都训不好?

2015年,普林斯顿大学搞了一项名为“脆弱家庭挑战”的研究。他们追踪了4000多名儿童从出生到15岁的数据,邀请全球160个团队用孩子9岁前的全部信息,来预测他们15岁时的表现——GPA、住房稳定性、家庭物质状况等6项指标。

结果令人大跌眼镜:最好的模型也只比随机猜测略强一点点。

很多人第一反应是:数据量不够大?不是。每个孩子已经收集了约1万个特征维度,已经多到超乎想象。

研究人员去回访预测误差最大的家庭,发现了一个关键细节:一个原本成绩较差的孩子突然表现出色,原因是邻居帮他辅导作业、提供食物。但这些“来自家庭外的支持”,数据里根本没有记录。

要解决这个问题,理论上需要记录孩子的一举一动,甚至每个念头——这在伦理、法律和实践层面都不可接受。这就是预测式AI在社会领域的第一重困境:数据维度的天然缺失

为什么图像识别就不会有这个问题?因为判断一张图里是猫还是狗,所需的所有信息已经完整地包含在图片里了。图片本身就是“完整的数据”,不存在关键信息的遗漏。

第二重困境在于问题本身的内在复杂性

社会规律是会变的。20年前的商业成功法则,放到今天可能就是“作死指南”。用历史数据训练的模型,本质上就是“刻舟求剑”。

社会事件还充满随机性。一本书的早期好评可能只是因为某个大V随手转了一下;一个人的成功可能只是因为某次会议上恰好坐在了贵人旁边。这些随机因素,本质上是不可预测的。

更麻烦的是“互动性难题”:预测行为本身会改变被预测的对象。节假日第一天上午高速公路会堵车——这个预测广为人知后,大家都提前到凌晨出发,结果凌晨堵了。预测改变了现实,现实推翻了预测。

这些局限是“可预见的”。一个清醒的AI设计者在部署模型之前,就应该知道:这类问题,AI就是搞不定。

第二重:隐蔽的陷阱——为什么有的AI“一学就会,一用就废”?

有的模型在测试集上表现优异,一到现实就拉胯。原因之一是“数据泄露”——测试集里的题目,模型在训练时已经见过了。好比考试卷子里的题你全做过,分数再高也不代表你真懂。

另一个更隐蔽的原因是:预测式AI经常把“相关性”当成“因果性”

新冠肺炎疫情期间,有大量研究声称能用胸部X光片高精度区分新冠患者和普通肺炎患者。但后来有人发现,在那些研究的数据集中,几乎所有新冠影像来自成人,所有普通肺炎影像来自儿童。AI学到的根本不是“磨玻璃影、白肺”这些真正的病理特征,而是“成人→可能得新冠,儿童→可能只是感冒”。

这个模式在原数据集上准确率极高,但逻辑是错的。而且因为训练集和测试集来自同一批数据,这个错误规律在测试中根本暴露不出来——直到模型被扔进真实世界,才原形毕露。

更棘手的是,当前的AI模型本质上是“黑箱”。数以万计的复杂参数中,我们无法直接审视它做判断的内在机理。当模型依赖虚假关联而非真正的因果特征时,这类错误极为隐蔽。

第三重:致命的偏差——当“优化目标”本身就是错的

这是最值得警惕的一类问题。AI训练的核心,是人为设定一个“优化目标”——一个明确的数学公式。模型不断调整内部参数,就是为了让这个目标函数的分数最优。

问题在于:如果目标本身有偏差,模型训练得再“完美”,结果也是错的。

书中列举了一个可怕的例子:美国一家保险公司用AI来调整汽车保险费率。它设定的目标是:在不流失过多客户的前提下,最大化利润

为了实现这个目标,模型需要解决一个核心问题:识别哪些客户对涨价不敏感。它发现,62岁以上老年人更换保险公司的倾向更低。于是,该人群被系统性地给予更少的折扣和更高的保费涨幅。

公司没有主观宣称“要歧视老年人”,但“利润最大化”这个目标函数与数据的结合,必然导向这一结果。更讽刺的是,开发者可以用“算法复杂性”当挡箭牌,声称这是“数据驱动的客观最优解”。

我们最需要警惕的,或许不是科幻片里的“机器人觉醒”,而是那些隐藏在冰冷数据和“客观”算法之下的、由错误的代理指标和商业利益驱动的、无声无息却影响深远的系统性偏见与歧视。

一句话总结:技术之上应有理性,理性之上应有良知。

第三部分:生成式AI的“幻觉”与“刷分竞赛”

“幻觉”:一本正经地胡说八道

大语言模型虽然聊天能力很强,但很容易“一本正经地胡说八道”——语言流畅、逻辑自洽、充满自信,但核心内容完全是假的。

为什么?因为大模型本质上是一个概率性的文本生成器。它通过在海量语料上训练,学习词语之间的统计关系,然后预测“下一个最有可能出现的词是什么”。它的目标是生成“看起来合理”的文本,而不是“真实”的文本。事实准确性,从来不是其核心设计目标。

基准测试陷阱:大家都在“应试”,没人关心“能力”

当前整个AI领域陷入了一场围绕“基准测试”的激烈竞赛。各大公司轮番发布在各项标准化测试中的“刷分”成绩。

但问题在于:这些测试只关注模型在特定任务上的表现,却不评估那些在现实世界中更重要的维度——模型是否固化了文化偏见?输出的内容是否会对社会稳定造成风险?这些在基准测试中统统是“隐形”的。

当所有开发者都以“分数”为唯一目标时,他们就会有意无意地“为测试而优化”。这就像一个只为应试而学习的学生,能熟练掌握所有考点,但在真实世界中解决复杂问题的能力却不堪一击。

衡量一项技术真实价值的唯一标准,是它在真实世界中的表现。

第四部分:AI会产生自我意识,从而威胁人类吗?

作者给出了否定的答案。他认为,即使在理论上有可能性,人类最大的威胁也不是来自AI“自主背叛”,而是来自人类对AI的滥用

为什么AI不会诞生自主意识?因为它所有行为都受限于一个由人类设定的、外在的目标函数。AI没有“内在驱动力”——它没有好奇心,没有求知欲,没有生存本能。它不会因为“想”理解世界而去学习,而只是因为“被设定”要去拟合训练数据中的统计模式。

而自主意识的核心,在于能够自主设定目标。一个有意识的生命体,其行为受内在、分层的目标驱动:从最底层的生存、繁衍,到更高层的自我实现。这些目标不是由外部工程师编码的,而是由亿万年的生物进化“写入”基因之中的。

当AI对你表达“同情”时,它并没有真正“感受”到你的情绪,只是学习到了在特定情境下,生成“表示同情的文本”能够最大化其目标函数。

所以,我们应该重点防范的不是一个遥远的、几乎不可能发生的“AI叛变”,而是AI这样一个没有意识、没有道德、但能力极其强大的工具,被别有用心的人用于牟利、诈骗、制造谎言、实施监控甚至发动战争。

第五部分:两个未来——凯的世界 vs 玛雅的世界

最后一章作者设想了两个出生在大模型时代的孩子——凯和玛雅——在不同假设的未来中,他们的生活会如何发展。

凯的世界:被动防御

社会对AI的风险充满警惕,学校禁止学生使用AI,大多数应用选择“一刀切”地屏蔽。但天性好奇的凯只能求助于那些未经审查的商业AI工具。社交媒体与AI深度融合,用算法生成了无穷无尽、令人上瘾的内容流,吞噬了凯的注意力。学校使用预测式AI,根据凯的成绩和家庭数据将他分入“低潜力”组,过早地限制了他的职业机会。整个社会弥漫着“工作即将被取代”的论调,让凯对学业和未来都丧失了动力。

凯的世界揭示了一个残酷的现实:以“保护”为名的被动防御,实际上是将塑造未来的权力拱手让给了不受约束的商业力量。

玛雅的世界:主动面对

AI影响的研究资金增加了10倍,监管跟上了技术发展。法律强制打破了推荐算法的垄断,催生了更健康的社交媒体生态。学校将AI素养视为核心能力,系统性地融入教学。

大多数大学录取转为“部分抽签制”,削弱了名校光环,社会评价体系变得更加多元和务实。AI主要负责自动化“任务”而非取代“职业”,企业也适应了定期对员工进行技能再培训的常态。玛雅对自己的未来充满信心。

哪个世界更有可能实现?

从今天的角度看,凯的世界更可能成为我们的“默认现实”。我们只需要继续以畏惧和顺从的态度回应科技行业的发展,便会自然滑向那里。而要实现玛雅的世界,则需要大量的公共投资和全社会态度的转变。

不作为,肯定不会带来一个理想的未来。

凯的沉沦,源于被动地接受;玛雅的希望,始于主动地面对。我们人类,永远不应该把选择权交给机器,而要牢牢把握在自己手中。

本文的要点也整理成了播客形式,放在小宇宙,方便大家收听:

https://www.xiaoyuzhoufm.com/episode/69eef24f1d989496e79b0446