书单之四:驯服AI,确保AI为我们服务

━━━━━━━━━━━━━━━━━━━━━━━━

作者简介

盖瑞·马库斯（Gary F. Marcus）盖瑞·马库斯（Gary F. Marcus）是心理学与脑研究专家，知名认知科学家、纽约大学心理学教授，同时也是人工智能领域的重要批评者和意见领袖。

学术背景与职业经历

• 纽约大学心理学教授、认知科学家

• 纽约大学婴幼儿语言学习中心主任

• Geometric Intelligence创始人（一家AI初创公司，后出售给Uber）

• Robust.AI联合创始人兼CEO

• 23岁获得麻省理工学院博士学位

• 师从史蒂芬·平克师从史蒂芬·平克（TED演讲人、世界超级语言学家和认知心理学家）

引言：如果硅谷不改弦更张，我们将失去社会

从社交媒体到生成式AI：一条危险的老路

社交媒体时代已经摧毁了隐私、极化了社会、加速了信息战。Facebook、Reddit等平台通过"注意力经济"获利，将用户变成了棋子。《通信规范法》第230条让社交媒体几乎不承担任何责任。

"如果'快速行动，打破常规'是社交媒体时代的非官方口号，那么生成式AI时代的口号几乎可以确定是一样的——只不过这次被打破的东西可能严重得多。"

生成式AI将使这一切雪上加霜：

• 整个职业群体将因大科技公司而失去生计

• AI生成的文章正在污染科学界

• 互联网正被大量AI垃圾内容充斥，日益不可信

Gary Marcus的立场

Marcus并非反技术者。他从8岁开始编程，创办了AI公司Geometric Intelligence并出售给Uber。他热爱AI并希望它成功——正因如此才对当前方向深感忧虑。

━━━━━━━━━━━━━━━━━━━━━━━━

一、生成式AI的技术真相与局限性

本质：统计拼接而非真正理解

大语言模型（LLM）的工作原理：给定一组词语（提示词），模型在每个时刻生成统计上最可能的下一个词——本质上是对训练数据中词语共现模式的概率预测，而非对世界含义的真正理解。

• 生成式AI起源于2017年的一篇关键论文

• 它"生成"词语序列、图像甚至视频，底层机制是统计拼接

• 不区分事实与虚构不区分事实与虚构：模型记录的是词语的统计规律，不理解所使用的概念

"幻觉"不是Bug，而是特性

LLM频繁"编造"信息不是偶然故障，而是其统计本质的必然结果。

"说谎者关心真相并试图隐藏它；胡说八道者不在乎自己说的是真是假。" — Harry Frankfurt

幻觉案例

案例	具体内容	根因分析
Bard虚构Marcus传记Bard虚构Marcus传记	编造了Marcus的书名、副标题、引言	统计拼接将不同来源的"Gary"混淆
"宠物鸡Henrietta""宠物鸡Henrietta"	ChatGPT声称Marcus有名叫Henrietta的宠物鸡	将Marcus与另一位Gary的统计信息混合
Musk车祸死亡Musk车祸死亡	LLM声称马斯克在车祸中去世	将"在Tesla中死亡"与"拥有Tesla"的统计信息混为一谈
LinkedIn简历造假LinkedIn简历造假	AI简历工具为记者添加从未做过的采访报道	统计推断"合理的职业细节"而非核实事实
Copilot会议摘要Copilot会议摘要	微软Copilot编造会议中从未讨论的内容	无法区分"听起来合理"与"确实发生过"

我们想要的AI vs 我们实际拥有的AI

维度	我们想要的AI	我们实际拥有的AI
可靠性	始终给出可靠答案	是一场"掷骰子"，每次可能不同
理解力	真正理解问题与语境	仅做统计模式匹配
一致性	答案一致、可验证	同一问题多次提问，答案可能矛盾
常识	具备人类级常识推理	经常犯低级逻辑错误
不确定性表达	知道自己不知道什么	不会表达不确定性，编造时同样自信
事实核查	能自我验证	完全没有事实核查能力

为什么更大的模型不能解决问题

1. 规模不等于理解：更大的统计模型仍然只是统计模型

2. 长尾问题：训练数据无法覆盖所有场景

3. 组合性缺失：人类能灵活组合不同类型智能，LLM无法做到

4. 纠错能力为零：LLM不知道自己何时出错

━━━━━━━━━━━━━━━━━━━━━━━━

二、生成式AI的十二大直接威胁

1. 就业冲击：不仅艺术家和作家受威胁，雇主的按键记录数据可能被用来训练替代你的AI

2. 网络犯罪升级：英国GCHQ警告"AI几乎肯定会增加网络攻击的规模和影响"

3. 语音克隆诈骗：犯罪分子用AI复制声音，冒充亲属实施绑架勒索

4. 深度伪造色情：每六个月翻一番

5. 民主选举威胁：2023年斯洛伐克选举可能因深度伪造而扭转

6. 虚假信息工业化：ChatGPT使生成令人信服的虚假叙事的成本趋近于零

7. 市场操纵：AI加持的"网红股"操纵将欺骗更多人

8. 隐私新危机：用户向聊天机器人倾诉的一切都在被上传利用

9. 聊天机器人伤害：已有人因与聊天机器人的负面互动而自杀

10. 隐蔽的偏见影响：聊天机器人可以在用户不知情的情况下微妙地改变其观点

11. 版权与知识产权：大公司公然侵犯艺术家和作家的权益

12. 环境代价：训练和运行大型AI模型的能源消耗巨大

2034年的"老大哥"

"在乔治·奥威尔的小说《1984》中，'老大哥'是政府；在2034年的现实世界中，'老大哥'的角色很可能由大科技公司来扮演。"

━━━━━━━━━━━━━━━━━━━━━━━━

三、硅谷的道德滑坡与责任缺失

企业文化的转折点

硅谷正在从"不作恶"走向"尽可能快地部署，不管后果如何"。

四大问题诊断

1. 技术缺陷：生成式AI对"真相与胡说八道之间的区别漠不关心"

2. 言行不一：AI公司大谈"负责任AI"，但行动与言辞完全不符

3. 过度炒作：AI被严重夸大，公司用"终将拯救社会"为当下侵害版权等行为辩护

4. AI寡头化：正在走向一个由少数科技巨头控制过多权力的局面

━━━━━━━━━━━━━━━━━━━━━━━━

四、硅谷如何操纵公众与政府

操纵公众：弥赛亚神话

硅谷通过塑造"AI将拯救人类"的叙事来转移对其负面影响的关注。

操纵政府：游说与政策影响

通过大规模游说、资助智库、制造"弹性"研究来影响政策制定。

━━━━━━━━━━━━━━━━━━━━━━━━

五、AI时代的公民权利捍卫

数据权与隐私

• 版权补偿：未经补偿不得用受版权保护的作品训练

• 知情同意：训练必须获得明确同意

• 数据透明：每个软件都应清晰声明收集了什么数据

透明度与问责

• 训练数据来源、算法、企业实践、造成的损害

• 何时、何地、如何使用了AI

• 对AI造成的伤害有清晰的法律追责

━━━━━━━━━━━━━━━━━━━━━━━━

六、AI素养与独立监管体系

AI素养教育

全社会需要提高对AI能力和局限的理解，避免被炒作和恐惧所左右。

独立监管机构

建立有权有能的AI专门监管机构，配备专业技术能力。

分层监管

按风险级别实施多层监管，高风险AI需要更严格的审查。

━━━━━━━━━━━━━━━━━━━━━━━━

七、激励可信AI与全球治理框架

激励好AI

对有益社会的AI给予税收优惠和其他激励措施。

国际治理

AI是全球性技术，需要国际合作来建立治理框架。

━━━━━━━━━━━━━━━━━━━━━━━━

八、走向可信AI的未来之路

路灯效应：AI研究的方向迷失

路灯寓言：一个醉汉在路灯下找东西。警察问他丢了什么，他说钥匙。"你确定丢在这里吗？""不，丢在公园里。""那为什么在这找？""因为这里有光。"

AI领域正犯着同样的错误：不是在应该寻找答案的地方寻找，而是在最容易获得资金和成果的地方寻找——即生成式AI和大型语言模型。

知识垄断的危害

• 80-90%的智力资源和资金都流向了LLM

• 这种知识垄断"吸走了房间里的氧气"

• 偏离主流的好主意可能没有人会听，也没有人会给足够的资金

幻觉问题的不可解性

核心矛盾：

- "统计上可能"≠ 真实

- 不能在一个不以事实为基础的系统中减少虚假信息

- 不能指望一个不知道什么是真相的AI系统不诽谤他人

四部分替代AI研究路线图

第一：整合神经网络与符号AI

方法	优势	劣势
神经网络	擅长从大数据中学习	难以可靠表示事实和推理
符号AI	擅长表示事实和可靠推理	难以自动学习
整合目标	兼得两者之长	这是AI领域最难的问题之一

第二：可靠的知识表示

没有AI能在不掌握大量事实和理论概念的情况下变得可靠。

第三：构建世界模型——理解事件的时间展开

生成式AI永远不会真正构建这样的世界模型——它只是在拼凑语言统计。

第四：可靠推理——即使面对陌生情境

LLM推理失败的本质：它不推理实际给定的信息，而是拼凑在类似语境中曾经有效的词语。

━━━━━━━━━━━━━━━━━━━━━━━━

九、16项综合行动纲领

数据权与隐私（4项）

#	要求	核心内容
1	版权补偿	未经补偿不得用受版权保护的作品训练
2	知情同意	训练必须获得明确同意，选择加入而非退出
3	不胁迫	用户有权在不提交数据的前提下使用产品
4	数据透明	每个软件都应清晰声明收集了什么数据、如何共享

透明度与问责（4项）

#	要求	核心内容
5	数据源透明	训练数据来源、算法、企业实践、造成的损害
6	使用透明	何时、何地、如何使用了AI
7	环境透明	AI的环境影响
8	明确责任	对AI造成的伤害有清晰的法律追责

监管与治理（6项）

#	要求	核心内容
9	独立监督	来自科学家和公民社会的独立监督
10	分层监管	按风险级别实施多层监管
11	事前评估	大规模部署前评估风险与收益
12	事后审计	部署后持续审计
13	激励好AI	对有益社会的AI给予税收优惠
14	AI素养	全面的AI素养教育项目

机构与国际合作（2项）

#	要求	核心内容
15	敏捷AI机构	建立有权有能的AI专门监管机构
16	国际治理	AI的国际治理合作

━━━━━━━━━━━━━━━━━━━━━━━━

十、核心论点

Marcus的诊断

1. 当前生成式AI在本质上是不可靠的

2. 硅谷正在从"不作恶"走向"尽可能快地部署，不管后果如何"

3. 正在形成AI寡头

4. 公民并非被动乘客

Marcus的处方

"我们不应该阻止AI。但我们应该坚持让它变得更安全、更好、更可信。"

"我们有权要求所有这些，并投票淘汰那些不迅速行动以确保AI拥有我们所需制衡的立法者。"

— END —

书单之三：美股AI宠儿的冷思考--科技共和国

书单之二：AI战争实录--Project Maven如何改变现代战争

书单之一：AI蛇油