声明:本公众号以分享市场信息,探讨经济相关知识为原则,仅与广大投资者分享交流,不构成投资建议。资本市场有风险,投资需谨慎。
本文来源于经济学人2026年5月9日刊,10-11页,原文标题Terrorism- From cyber-security to biosecurity(恐怖主义——从网络安全到生物安全),文中观点仅代表《经济学人》一家之言,读者们可舍短取长。正文可能有删改,使用AI工具翻译及配图配文
导读:人工智能正突破生物学危险门槛,Mythos模型已能完成人类无法做到的逆向还原细胞等任务,可能使独行者合成病毒。现有防护存在致命漏洞,根本出路在于破解神经网络黑箱、创造安全技术。此前,必须严格限制可能助长生物恐怖的强大模型访问权限,尤其是开源模型。
世界必须阻止人工智能助长生物恐怖分子
人工智能很快将把生物学列入其超人能力清单。Anthropic的Mythos模型——因其黑客能力已被限制公开发布——最近在生物学专家汇集的最困难的数据处理任务中,成功应对了其中三分之一。Mythos能够完成所有受测试人类都无法做到的事情,比如根据原始DNA数据逆向还原一种细胞类型。
正如我们的报道所述,此类问题求解能力意味着,人工智能或许很快将赋予人类极其危险的力量:合成病毒、产生新型神经毒素,或组装出可能导致全人类灭绝的"镜像生命"。这些危险,是人工智能美妙承诺——让智能普及大众——的阴暗面。甚至可以想见,一个人工智能,可能赋予一个厌世独行者终结人类的力量。
生物安全风险因此远甚于网络安全风险。如果一种经设计的病毒可能造成数十亿人死亡,人类便没有从错误中学习的余地。或许并不存在所谓的"防御者红利"——即人工智能自身帮助预先防范危险。软件可以快速修复,但人类生物学的可塑性则低得多。因此,要让模型在发布时确保安全,将需要在人工智能的基础科学领域取得突破。
还有多少时间?当今公开可用的人工智能模型具有书本上的聪明才智,在纸面测试中表现出色,但幸运的是,在实验室操作台前似乎仍几乎无法给予新手实际帮助。然而,(非公开的)Mythos的制造商Anthropic警告称,它或许很快就能引导新手完成棘手的实验室操作。Mythos及其同类模型尚未就其实际能力接受测试,这意味着它们或许已具备此种能力。
拥有此类才能的模型,将如同核武器一样,在公众手中永无安全可言。而当今用以确保它们安全的技术手段尚显不足。例如,其中一种选项是试图让模型拒绝危险请求。通过诱使它们给出被禁答案以"越狱"这些模型的做法已变得更加困难,但在近期一项研究中,90%的新手参与者仍能从本应闭口不言的模型处套取出病毒学相关答案。将人类的未来押注在此类防护措施上,将是一个错误。
另一项措施是从模型的训练运行中排除危险数据。智库SecureBio建议删除有关镜像生命、获取活体病原体、绕过生物防御护栏以及评估大流行潜力的信息。问题在于,一个能力足够的模型,或许能从第一性原理出发,推导出已被删去知识。类似的、从图像生成器的训练数据中移除儿童性虐待材料的尝试,并未成功。一个基于无害图像训练的系统,能够描绘出它从未见过的淫秽内容。
第三种思路是聚焦物理世界。政府的安保部门能够且理应更多关注那些既能用于合法目的、也可能被用于邪恶用途的技术供应商,比如DNA合成领域。"了解你的客户"这类法规,应将此类服务限制在已有建树的研究人员范围内。但制造病毒不像制造核弹,后者需要稀缺且可追踪的材料。在生物学领域,使用现成技术达成致命目的相对容易。国家无法监控每一个培养皿。
因此,将需要科学突破,以创造新类型的安全防护措施。一个有前景的方法,相当于在模型训练完成后,对其施行脑外科手术。另一种技术则引导模型在某些领域偏好错误答案;还有一种方法,可能是揭示并禁用那些在合成生物学工作中被激活的神经元。这将需要基础性的人工智能科学取得进展,以破解现有神经网络的"黑箱"。
令人毛骨悚然的培养皿
在此类技术诞生之前,各国政府必须限制对可能助长生物恐怖主义系统的访问。这对开源模型尤其重要,因为它们一旦传播便无法召回,且其使用也无法监控。负责任的研究人员应当能够在安全规程下,使用人工智能推进科学前沿——例如,DeepMind旗下的同构实验室正在开发新型癌症疗法——但如果人工智能同时赋予恐怖分子令人类灭绝的力量,那么利用它来改善生活便毫无意义。
夜雨聆风