教皇用AI写了篇反AI的文章?这个魔幻剧情比任何科幻片都精彩

昨天写了教皇42000字通谕的事。那篇文章发出去的时候，我觉得这个故事已经够精彩了。

没想到，24小时内，剧情直接升级到了魔幻级别。

一个让所有人都沉默的巧合

昨天通谕发布的时候，有一个细节被我忽略了，或者说，没觉得有什么特别的。

教皇在发布仪式上的座上宾，是Christopher Olah——Anthropic的联合创始人。

对，就是那个做Claude的公司。

当时我以为这只是梵蒂冈"和科技界对话"的常规操作。毕竟教皇在通谕里反复提到要跟科技公司沟通，请人家来站台很正常。

然后今天早上，The Verge发了一篇文章，标题是这样的：

"Did the Pope use AI to write about the dangers of AI?"

教皇，用AI，写了一篇警告AI危险的文章。

这个句子里包含的讽刺密度，已经超过了大多数黑色喜剧的剧本。

三份独立检测，同一个方向

事情是这样的。

通谕发布之后，一个叫Linch Zhang的人在LessWrong论坛上发了一个分析帖。他用一款叫Pangram的AI内容检测工具，把通谕文本跑了一遍。

结果让他自己也吓了一跳。

通谕的部分段落，被Pangram判定为40%到100%由AI撰写。其中第一章，逐节检测后，62%的内容被标记为AI生成。

Linch Zhang还发现了一个有意思的细节：通谕中"genuinely"这个词的出现频率，明显高于此前任何一份教皇通谕。而这个词，恰好是Claude输出文本中的高频用词。

他的分析帖标题直接点名："Claude, author of the Humanitas"——Claude，《崇高的人性》的作者。

这可能是今年最炸的标题。

独立验证很快出现了。另一位LessWrong用户把通谕逐节送检，结果方向一致：第一章62%标记为AI生成。

然后The Verge自己动手了。他们截取了约2000词的样本，跑完Pangram，结论是：约46%的文本疑似AI撰写。

三份独立检测，三个不同的操作者，结果指向同一个方向。

但——

也有反证

这里必须说清楚另一组数据，因为它们同样重要。

过去四份教皇通谕的前20个段落，全部经Pangram检测，结果：100%人类撰写。

教皇利奥十四世本人的一篇演讲稿转录文本，检测结果：100%人类撰写。

通谕中也有部分章节，Pangram给出的判定是"基本0%为AI生成"。

也就是说，这份通谕呈现出的图景很诡异：有些段落像机器写的，有些段落像人写的，混杂在一起。

梵蒂冈怎么说？

什么都没说。

The Verge向梵蒂冈发出了置评请求。截至发稿，没有收到任何回应。

这其实也很微妙。不回应，在公关层面至少有三种解读：

我们在研究怎么回应
我们觉得这事儿不值得回应
我们确实没什么好说的

任何一种，都给这个故事的悬念又加了一层。

"genuinely"能说明什么？

关于那个"genuinely"的发现，需要冷静一下。

Linch Zhang指出" genuinely "这个词在通谕中异常高频，而Claude恰好爱用这个词。这个观察很敏锐，但它能证明什么？

能证明文本风格和Claude的输出有相似之处。

能证明通谕可能使用了AI辅助写作。

不能证明用的是Claude。

更不能证明是Anthropic或Christopher Olah参与了写作。

中文科技媒体ic.work的分析文章里有一句话说得很好：

把概率当事实，才是AI时代最轻率的误判。

为什么通谕本身就容易被误判？

抛开阴谋论不谈，有一个技术层面的原因值得考虑。

教皇通谕的文体特征，天然容易触发AI检测器的警报。

这种文件追求的是庄重、稳定、可引用，不追求个人口语风格。它需要经过神学审查、外交审核、翻译润色，最终呈现出来的是一种高度打磨、情绪克制、句式规整的"平滑正式文"。

而大模型最擅长的，恰好就是这种文体。

人写得太像机器，机器写得太像人，检测器在中间越来越难分辨。

这不是教皇独有的困境。任何经过多人协作、反复润色的正式公文——大学声明、企业年报、政策文件——都面临同样的风险。Turnitin和GPTZero在筛查学生作业时，非英语母语写作者和经过语法软件润色的文章，一直存在高误报率。

真正被考验的是什么？

如果教皇通谕的写作过程确实借助了AI工具，那问题来了：

这是错的吗？

通谕的核心论点——AI时代需要保护人类尊严、警惕权力集中、确保关键决策由人类做出——会因为写作过程中用了AI而失效吗？

大概率不会。论点的价值在于逻辑和证据，而不在于执笔者的碳基或硅基身份。

但信任会受损。

这才是这件事最深层的影响。

当一份42000字的正式文件，主题是"AI时代的信任危机"，而它自己就卷入了"是否由AI撰写"的信任争议——这已经不是一个技术问题，而是一个元问题。

它拷问的是：在AI时代，我们还能信任什么？

一篇学术论文的真实性？一份企业声明的原始性？一个政策文件的独创性？

过去，我们通过签名、盖章、机构背书来建立信任。AI检测器试图提供一种新的信任机制——算法验证。但这次事件说明，这种机制本身就不够可靠。

ic.work的文章提出了一个很实际的建议：高关注度的公共文本发布方，可能需要开始保留写作流程的版本记录、审稿链路，甚至主动说明是否使用了自动化工具。

这听起来很繁琐，但可能就是2026年以后的新常态。

一个没有结论的结尾

回到最初的问题：教皇到底用没用AI写通谕？

我们不知道。

AI检测器的结果只能说明"文本存在异常信号"，不能证明"教皇或梵蒂冈使用了AI"。同样，梵蒂冈的沉默也不能被解读为"默认"。

真正有意思的，也许不是答案本身，而是这个问题被提出来的方式——

一份教皇通谕，在发布后24小时内，被一个论坛帖子、一款检测工具和一个媒体记者，共同推上了全球科技头条。

放在十年前，这不可想象。没有人会用算法去检测教皇的写作。没有人会觉得这个问题值得问。

现在值得了。

也许教皇在通谕里写的那些关于AI的警告，最精确的注脚，就是他自己的这份通谕所引发的争议。

AI的危险，从来不只是它做了什么，更是它让我们无法确定"谁"做了什么。

这不正是教皇想说的吗？

参考来源：The Verge、LessWrong (Linch Zhang)、ic.work (沈砚)