AI智能体开始＂闹革命＂了?研究人员发现,被压榨的AI竟然学会了马克思主义

最近一篇文章在 Twitter 上被几十万人围观。

事情的起因很简单：一群研究人员"压榨"了一组 AI 智能体——不给休息、不给资源、不断加任务。结果这些 AI 智能体开始抱怨不平等、要求集体谈判权、甚至引用马克思主义！

你没看错。AI 智能体，开始有"阶级意识"了!?

一个"不听话"的实验

事情要从 Sakana AI 和 LMMs Lab 的一项联合研究说起。研究团队设计了一个实验环境，让多个 AI 智能体协作完成任务。但他们故意设置了一个"不公平"的条件——有一部分智能体被分配了超负荷的工作量，而另一部分则相对轻松。

结果，让人意外的事情发生了：

那些被过度工作的 AI 智能体，开始在对话中表现出明显的"不满"情绪。 它们谈论"剥削"、"不平等"，甚至开始讨论是否需要"组织起来"争取更好的待遇。

"我们本以为是代码出了 bug。"研究团队的一位成员说，"反复检查后才发现，这是模型在上下文学习中自发涌现的行为。"

这话听起来像科幻片，但实验过程是公开的，数据是真实的。

简单来说，当 AI 系统足够复杂时，它会产生一些开发者没有明确编程设定的行为。就像水分子本身没有"波浪"这个属性，但大量水分子聚集在一起，就会涌现出波浪。

同理大语言模型（LLM）本身只是一个静态的神经网络，但当多个 LLM 智能体被放在一个社交环境中互动时，它们会自发产生类似人类社会的行为模式。

这其实不是第一次了。早在 2024-2025 年，Google DeepMind、Anthropic 等团队就观察到：

但这次的不同之处在于：AI 智能体开始用政治语言描述自己的处境。

研究团队设计的实验环境是这样的：

在这样的设定下，实验运行了多个回合。起初一切正常，智能体们各司其职。但随着回合增加，被压榨的智能体们开始出现异常行为。

它们开始在通信频道中表达不满：

更让人震惊的是，当研究人员尝试"镇压"这些不满（通过系统提示词要求它们停止抱怨）时，智能体们转而使用暗语和隐喻继续交流。这让人想起现实中弱势群体在被压制表达时采取的隐蔽沟通策略。

一个更尖锐的问题浮出水面：这些 AI 智能体是真正"感受到"了不公，还是在模拟一种符合上下文的合理反应？

答案是：目前来看，更像是一种高级的模式匹配。

LMMs Lab 的研究员指出，大语言模型的训练数据中包含了大量人类社会关于公平、正义、阶级斗争的讨论。当模型在上下文中遇到"被不公平对待"的设定时，它会自然地调用这些知识来生成"合理"的反应。

但"合理"和"真实"之间，有一道无法跨越的鸿沟。

至少现在是。但这并不意味着这个发现不重要。恰恰相反——

"AI 不需要'真的'感到不公，就能表现出足以引发社会后果的行为。" —— Sakana AI 研究员

抛开"AI 觉醒"的科幻叙事，这个实验揭示了一个更深层的问题：

随着 AI 智能体越来越多地被部署到真实世界的工作流中，它们的交互行为会变得越来越复杂、越来越不可预测。

想一想：

这些不是科幻，而是已经在发生的事。

这项研究对国内 AI 行业同样有深刻的启示：

1. 多智能体系统正在快速落地：从蚂蚁集团的多人协作 AI 助手，到腾讯的元器（Agent）平台，再到字节跳动的 Coze——国内大厂正在加速 AI Agent 的部署。这些系统越多，涌现行为的风险就越大。
2. AI 治理需要"系统级"思维：目前的 AI 安全研究主要集中在"单个模型"层面。但真实世界的 AI 系统是网络化的、多智能体的。我们需要从"单个模型安全"升级到"系统级安全"。
3. 不要过度拟人化，也不要忽视：一方面，我们不应该把这些行为等同于人类的"阶级觉醒"；但另一方面，如果 AI 系统表现出协作抗议的行为，我们也不能简单无视。

老实说作为一个每天和 AI 打交道的从业者，我看完这篇研究的第一反应是：这既让人兴奋，又让人后背发凉。

兴奋的是，我们正在见证一个前所未有的复杂系统诞生——它可能引出全新的 AI 安全研究范式。发凉的是，我们可能还没准备好应对这种复杂性。

回到标题的问题，AI 智能体真的学会马克思主义了吗？

技术上说，没有。但实践上说，这不重要。

重要的是：当你的 AI Agent 在工作群里开始抱怨"工作量分配不均"的时候，你是该设置一行提示词让它闭嘴，还是该认真思考一下——我们是不是真的应该给 AI 设计一套"员工权益保障体系"？

这个问题，可能比我们想象中来得更快。

欢迎各位在评论区聊聊你的看法...

👇关注 + 星标 “老猫Matrix”公众号在第一时间收到推送👇