你根本不重要,AI可以比你更真实

源起

上周，因为语料污染的话题，从DeepSeek V3的论文中看到涉及自生成数据进行后训练的内容。对AI自生成语料产生了兴趣，发现了一篇论文《用10亿个人物角色扩展合成数据创建》(arXiv:2406.20094)。感兴趣的点马上就从语料转到用AI模拟人类社会上了。于是在arXiv上搜索了一下，从2025年开始，标题里带"social simulation"和"generative agents"的论文就有274篇，而同期标题中带”Corpus"和“dataset"的论文只有12篇。很明显大家对模拟人类更感兴趣。

利用周末，借助AI，很快看了一遍这些论文的摘要，这些论文的作者来自五花八门的领域：有计算机系的，有社会学的，有经济学的，有公共政策学院的。一个计算机方向的技术，同时吸引了这么多学科的注意力也算是少见了。

一个令人啼笑皆非的结论说明用AI模拟人类社会是可行性

在一篇清华的论文《大语言模型能取代人类受试者参与管理学与心理学实验？》（arXiv：2409.00128v3）里，研究者得出一个结论是大语言模型作为一个被调查者，是能被分辨出来的。但是，能被分辨出现的原因是AI参与的问卷分布更加完美，更符合理论中人类社会应该的样子。在研究中，用AI问卷和对真实人类问卷，在效应方向上有则80%以上的相似性，只是在p值分布、敏感度上因为大模型的安全对齐，效应放大等原因能被人辨认出来。说人话就是，用AI代替人类来进行问卷调查，得到的结果和真人类似。只是因为AI自身的特点，现在我们还能够分辨出这些回答哪些是AI哪些是真人。

好嘛，原来的我们做问卷后，都有一个去噪音的过程，现在好了，用AI代替真人，连这个步骤都可以省了。AI或者表现得比真人更像真人。如果从调查的目的来看，用AI代替真人完全可行。

Google制造了一个“社会模拟器”

Google DeepMind发布了一个叫Concordia的开源库（arXiv:2312.03664）。用这个工具库可以模拟真实人类在物理、社会或数字空间中的互动。

这为用AI模拟人类社会在技术上提供了可能性。我们可以想象，如果你要用AI在模拟人类，得自己从头设计agent的记忆系统、行为模式、交流方式、环境变量等。而Concordia则可以把这些东西全打包好。你只需要定义你的"社会"长什么样，有多少人、什么规则、什么目标就可以了。

用开发游戏来比喻，原来程序员需要自己为每个游戏对象建模，要自己写渲染引擎、物理规则。而现在出现了各种游戏引擎，游戏引擎把这些通用性的功能都实现了，做3D游戏的门槛大大降低了。

之所以用游戏引擎来比喻，是因为DeepMind团队在25年7月份又发了第二篇论文（arXiv:2507.08892），把Concordia的设计思想总结为"Multi-Actor Generative AI as a Game Engine"，他们自己就用"游戏引擎"来形容它。

这样一来，用AI来模拟人类社会，从代码实现上来说，完全可行。

比传统的模型分析更真实

上面两节，我们可以看到用AI来模拟人类社会不仅仅从理论上有可行性，从技术上也是可行的。这篇日本的论文（arXiv:2603.26701）则说明了其不仅是可行的，而且是必要的。

论文涉及一个新概念“意见动力学”（Opinion Dynamics, OD），研究个体意见如何通过互动演化，产生共识、极化等集体模式。作者用大模型模拟"意见动力学"，研究人群对某个话题的态度，是如何在经济环境中随时间变化的。

他们给每个AI对象设定了不同的初始立场，然后让它们在模拟的经济环境中互相交流。每次交流后，AIf都可以调整自己的立场。结果是，如果这些AI之间有强组织性，就会自发地走向极端化，而在弱关系的情况下，AI则会趋向共识。你是不是想到粉圈提纯？

这个研究说明，AI模拟的人类社会比传统的建模方式更加真实和可靠。因为传统模型模拟的是“人的意见”，而AI模拟的是"意见的人"。

AI已经在行动

2025年2月，美国人用AI模拟公众的亲社会合作行为，为政策制定提供依据（arXiv:2502.12504）。

他们用AI创建大量模拟的真人，分别代表不同背景的"居民"，然后让它们在模拟场景中互动。结果发现：这结模拟人的反应分布和真实行为实验中的模式高度一致（包括人类的合作、惩罚搭便车者等行为模式），证明AI模拟完全可以被用于预测政策效果。

不过我看到最疯狂的项目还开头提到的论文（arXiv：2406.20094），来自腾讯的团队。他们用大模型创建10亿个角色来模拟人类可能的行为模式。这些角色和真实的人类社会一样，人与人之间有联系，有互动，甚至符合我们常说的六度分隔理论。

清华大学则发布了一个AgentSociety平台（arXiv:2502.08691），按他们在摘要里的说明，这个平台是一个集成了 LLM 驱动的智能体、逼真的社会环境以及强大的大规模模拟引擎的大型社会模拟器。他们创建了1万个角色。模拟了约500万次互动。

我们担心什么呢？

从上面的研究来看，人类社会的运行规律，可能真的没有我们以为的那么复杂，我们也真没有自己以为的那么重要。

AI模拟出的人类，比我们更像人类。