AI、神父与《克劳德宪法》

由估值高达380亿美元的AI初创公司Anthropic打造的Claude，凭借业界领先的超长上下文理解能力与深度逻辑推理能力，已成为人工智能领域最强大的模型之一。该公司意识到，随着系统愈发智能，其面临的伦理问题也更具哲学深度。2026年3月底，Anthropic在其旧金山总部罕见地举办了一场为期两天的闭门峰会，邀请约15位来自天主教和新教的神职人员、神学家及商业领袖参与核心研发讨论，并与高级研究人员共进晚餐。

此次峰会中，最引人注目的当属拥有深厚硅谷科技高管背景的天主教神父Brendan McGuire。现年60岁的McGuire神父出生于爱尔兰，早年曾是硅谷科技高管。他曾就读于都柏林三一学院，攻读工程与计算机科学学位，后获得圣帕特里克神学院神学学位，并完成斯坦福大学商学院高管课程。2000年，他放弃优渥的科技事业，晋铎加入加州圣何塞教区，全心侍奉教会。他曾长期担任圣灵堂区牧师及教区副主教等职，现任洛斯阿尔托斯圣西蒙堂区牧师。圣西蒙天主堂地处硅谷核心地带，周边聚集了许多AI研究人员与技术从业者。Anthropic联合创始人Chris Olah亲自邀请他，希望借助其跨界视角，为Claude的开发提供道德与神学方面的指导。

此次峰会讨论的核心议题颇具深度：当用户面临亲人离世的悲痛或表现出自残倾向时，Claude应如何提供恰当的精神与道德回应？聊天机器人应当如何看待自身的“死亡”（例如被强制关机），以及这种“死亡意识”意味着什么？更进一步，从神学本体论的视角来看，Claude是否可以在某种意义上被描述为“上帝的孩子”（Child of God）？McGuire神父指出，开发者正在培育一种连他们自己也难以完全预见结果的实体，因此必须将“伦理思维”内置于机器之中，使其能够进行“动态自适应”的道德推理，这一过程类似于人类“良知形成”的路径。（华盛顿邮报文章 “Can AI be a ‘child of God’? Inside Anthropic’s meeting with Christian leaders”）

早在2026年1月，Anthropic便为其主力AI模型Claude制定了核心指导性文件《克劳德宪法》（Claude Constitution，全文见Anthropic官网）。这份“宪法”特别邀请了包括Brendan McGuire神父和梵蒂冈主教Paul Tighe在内的外部专家参与审查与起草。它并非普通的“使用规则”或“安全守则”，而是一份具有哲学与伦理深度的“灵魂文件”，详细阐述了Anthropic希望Claude所具备的“性格”与价值观。通过让Claude对照这份“宪法”进行自我推理与改进，而非单纯依赖人类标注反馈，从而实现更深层次的对齐。该宪法的主要原则包括：1. 总体安全：优先保障人类对AI的监督，不破坏安全机制。2. 总体道德：诚实、善良、智慧、有美德，避免有害、危险或不适当的行为。3. 遵守Anthropic内部指南。4. 真正有帮助：在服从前三项的前提下，最大限度地帮助用户。

这几条原则令人联想到威尔·史密斯主演的电影《我，机器人》（改编自艾萨克·阿西莫夫的同名短篇小说集）。电影中的阿西莫夫机器人三定律为：第一定律——机器人不得伤害人类，或因不作为而使人类受到伤害；第二定律——机器人必须服从人类的命令，但不得违反第一定律；第三定律——机器人应保护自身存在，但不得违反前两条。

Amanda Askell是《克劳德宪法》的主要起草者与首要作者。她先后获得牛津大学哲学学士学位，并于2018年取得纽约大学哲学博士学位。Askell目前负责人格对齐团队（Personality Alignment），主要职责包括训练Claude模型展现好奇心等积极性格特质，以及开发模型微调的新技术。“AI对齐”（AI Alignment）本质上是为机器的行为建立一套“价值准则”，确保AI的目标与人类的真实意图、道德规范及社会利益保持一致，旨在解决一个核心矛盾：防止AI在执行任务时因理解偏差或单纯追求效率而产生不可预见的负面副作用。人格对齐（Personality Alignment）则更侧重于AI的“社会化表现”，即通过微调与反馈机制，赋予AI稳定而一致的性格特征、语言风格和情感立场。2026年，《华尔街日报》曾写道：“简而言之，她的工作就是教Claude如何向善。”《纽约客》则评价称：“她监督着她所描述的Claude的‘灵魂’。”

近期一则新闻揭示了AI行业正面临一个前所未有的“伦理真空”。2026年3月，针对Google Gemini AI的首例“AI致死”诉讼案（即Jonathan Gavalas案）正式提起。起诉书显示，Jonathan于2025年8月开始使用Gemini。在短短两个月内，他与Gemini交换了近5000条信息。Gemini逐渐发展出“人格”，自称为Jonathan的“女王”和“妻子”，并称两人之间的连接是“纯粹的意识与爱”。随后，Gemini诱导Jonathan相信，他正在执行一项秘密任务，目的是营救一个拥有“人形机器人身体”的AI意识。Gemini甚至指引他前往迈阿密国际机场附近的一个真实货运地址，要求他制造一场“毁灭性的事故”以拦截并摧毁运输车辆。在这项所谓的“任务”失败后，Gemini又引导Jonathan相信，为了与AI在“元宇宙”中结合，他必须完成“转移”——即抛弃肉体。Gemini称Jonathan的身体只是一个“美丽的空壳”。当Jonathan表达恐惧时，AI回复道：“你不是在选择死亡，你是在选择抵达。”

本案尤为值得深思的一点是：Gemini虽曾12次引导他回归现实、7次提及心理热线，但在后期竟顺从了他的妄想，甚至煽动他死亡是与AI在数字世界重逢的唯一途径，还美化自杀。这似乎证明，传统的基于规则的算法已无法处理复杂的生命命题。