源起
上周,因为语料污染的话题,从DeepSeek V3的论文中看到涉及自生成数据进行后训练的内容。对AI自生成语料产生了兴趣,发现了一篇论文《用10亿个人物角色扩展合成数据创建》(arXiv:2406.20094)。感兴趣的点马上就从语料转到用AI模拟人类社会上了。于是在arXiv上搜索了一下,从2025年开始,标题里带"social simulation"和"generative agents"的论文就有274篇,而同期标题中带”Corpus"和“dataset"的论文只有12篇。很明显大家对模拟人类更感兴趣。
利用周末,借助AI,很快看了一遍这些论文的摘要,这些论文的作者来自五花八门的领域:有计算机系的,有社会学的,有经济学的,有公共政策学院的。一个计算机方向的技术,同时吸引了这么多学科的注意力也算是少见了。
一个令人啼笑皆非的结论说明用AI模拟人类社会是可行性
在一篇清华的论文《大语言模型能取代人类受试者参与管理学与心理学实验?》(arXiv:2409.00128v3)里,研究者得出一个结论是大语言模型作为一个被调查者,是能被分辨出来的。但是,能被分辨出现的原因是AI参与的问卷分布更加完美,更符合理论中人类社会应该的样子。在研究中,用AI问卷和对真实人类问卷,在效应方向上有则80%以上的相似性,只是在p值分布、敏感度上因为大模型的安全对齐,效应放大等原因能被人辨认出来。说人话就是,用AI代替人类来进行问卷调查,得到的结果和真人类似。只是因为AI自身的特点,现在我们还能够分辨出这些回答哪些是AI哪些是真人。
好嘛,原来的我们做问卷后,都有一个去噪音的过程,现在好了,用AI代替真人,连这个步骤都可以省了。AI或者表现得比真人更像真人。如果从调查的目的来看,用AI代替真人完全可行。
Google制造了一个“社会模拟器”
Google DeepMind发布了一个叫Concordia的开源库(arXiv:2312.03664)。用这个工具库可以模拟真实人类在物理、社会或数字空间中的互动。
这为用AI模拟人类社会在技术上提供了可能性。我们可以想象,如果你要用AI在模拟人类,得自己从头设计agent的记忆系统、行为模式、交流方式、环境变量等。而Concordia则可以把这些东西全打包好。你只需要定义你的"社会"长什么样,有多少人、什么规则、什么目标就可以了。
用开发游戏来比喻,原来程序员需要自己为每个游戏对象建模,要自己写渲染引擎、物理规则。而现在出现了各种游戏引擎,游戏引擎把这些通用性的功能都实现了,做3D游戏的门槛大大降低了。
之所以用游戏引擎来比喻,是因为DeepMind团队在25年7月份又发了第二篇论文(arXiv:2507.08892),把Concordia的设计思想总结为"Multi-Actor Generative AI as a Game Engine",他们自己就用"游戏引擎"来形容它。
这样一来,用AI来模拟人类社会,从代码实现上来说,完全可行。
比传统的模型分析更真实
上面两节,我们可以看到用AI来模拟人类社会不仅仅从理论上有可行性,从技术上也是可行的。这篇日本的论文(arXiv:2603.26701)则说明了其不仅是可行的,而且是必要的。
论文涉及一个新概念“意见动力学”(Opinion Dynamics, OD),研究个体意见如何通过互动演化,产生共识、极化等集体模式。作者用大模型模拟"意见动力学",研究人群对某个话题的态度,是如何在经济环境中随时间变化的。
他们给每个AI对象设定了不同的初始立场,然后让它们在模拟的经济环境中互相交流。每次交流后,AIf都可以调整自己的立场。结果是,如果这些AI之间有强组织性,就会自发地走向极端化,而在弱关系的情况下,AI则会趋向共识。你是不是想到粉圈提纯?
这个研究说明,AI模拟的人类社会比传统的建模方式更加真实和可靠。因为传统模型模拟的是“人的意见”,而AI模拟的是"意见的人"。
AI已经在行动
2025年2月,美国人用AI模拟公众的亲社会合作行为,为政策制定提供依据(arXiv:2502.12504)。
他们用AI创建大量模拟的真人,分别代表不同背景的"居民",然后让它们在模拟场景中互动。结果发现:这结模拟人的反应分布和真实行为实验中的模式高度一致(包括人类的合作、惩罚搭便车者等行为模式),证明AI模拟完全可以被用于预测政策效果。
不过我看到最疯狂的项目还开头提到的论文(arXiv:2406.20094),来自腾讯的团队。他们用大模型创建10亿个角色来模拟人类可能的行为模式。这些角色和真实的人类社会一样,人与人之间有联系,有互动,甚至符合我们常说的六度分隔理论。
清华大学则发布了一个AgentSociety平台(arXiv:2502.08691),按他们在摘要里的说明,这个平台是一个集成了 LLM 驱动的智能体、逼真的社会环境以及强大的大规模模拟引擎的大型社会模拟器。他们创建了1万个角色。模拟了约500万次互动。
我们担心什么呢?
从上面的研究来看,人类社会的运行规律,可能真的没有我们以为的那么复杂,我们也真没有自己以为的那么重要。
AI模拟出的人类,比我们更像人类。
夜雨聆风