昨天写了教皇42000字通谕的事。那篇文章发出去的时候,我觉得这个故事已经够精彩了。
没想到,24小时内,剧情直接升级到了魔幻级别。
一个让所有人都沉默的巧合
昨天通谕发布的时候,有一个细节被我忽略了,或者说,没觉得有什么特别的。
教皇在发布仪式上的座上宾,是Christopher Olah——Anthropic的联合创始人。
对,就是那个做Claude的公司。

当时我以为这只是梵蒂冈"和科技界对话"的常规操作。毕竟教皇在通谕里反复提到要跟科技公司沟通,请人家来站台很正常。
然后今天早上,The Verge发了一篇文章,标题是这样的:
"Did the Pope use AI to write about the dangers of AI?"
教皇,用AI,写了一篇警告AI危险的文章。
这个句子里包含的讽刺密度,已经超过了大多数黑色喜剧的剧本。
三份独立检测,同一个方向
事情是这样的。
通谕发布之后,一个叫Linch Zhang的人在LessWrong论坛上发了一个分析帖。他用一款叫Pangram的AI内容检测工具,把通谕文本跑了一遍。
结果让他自己也吓了一跳。
通谕的部分段落,被Pangram判定为40%到100%由AI撰写。其中第一章,逐节检测后,62%的内容被标记为AI生成。
Linch Zhang还发现了一个有意思的细节:通谕中"genuinely"这个词的出现频率,明显高于此前任何一份教皇通谕。而这个词,恰好是Claude输出文本中的高频用词。
他的分析帖标题直接点名:"Claude, author of the Humanitas"——Claude,《崇高的人性》的作者。
这可能是今年最炸的标题。
独立验证很快出现了。另一位LessWrong用户把通谕逐节送检,结果方向一致:第一章62%标记为AI生成。
然后The Verge自己动手了。他们截取了约2000词的样本,跑完Pangram,结论是:约46%的文本疑似AI撰写。
三份独立检测,三个不同的操作者,结果指向同一个方向。
但——
也有反证
这里必须说清楚另一组数据,因为它们同样重要。
过去四份教皇通谕的前20个段落,全部经Pangram检测,结果:100%人类撰写。
教皇利奥十四世本人的一篇演讲稿转录文本,检测结果:100%人类撰写。
通谕中也有部分章节,Pangram给出的判定是"基本0%为AI生成"。
也就是说,这份通谕呈现出的图景很诡异:有些段落像机器写的,有些段落像人写的,混杂在一起。
梵蒂冈怎么说?
什么都没说。
The Verge向梵蒂冈发出了置评请求。截至发稿,没有收到任何回应。
这其实也很微妙。不回应,在公关层面至少有三种解读:
我们在研究怎么回应 我们觉得这事儿不值得回应 我们确实没什么好说的
任何一种,都给这个故事的悬念又加了一层。
"genuinely"能说明什么?
关于那个"genuinely"的发现,需要冷静一下。
Linch Zhang指出" genuinely "这个词在通谕中异常高频,而Claude恰好爱用这个词。这个观察很敏锐,但它能证明什么?
能证明文本风格和Claude的输出有相似之处。
能证明通谕可能使用了AI辅助写作。
不能证明用的是Claude。
更不能证明是Anthropic或Christopher Olah参与了写作。
中文科技媒体ic.work的分析文章里有一句话说得很好:
把概率当事实,才是AI时代最轻率的误判。
为什么通谕本身就容易被误判?
抛开阴谋论不谈,有一个技术层面的原因值得考虑。
教皇通谕的文体特征,天然容易触发AI检测器的警报。
这种文件追求的是庄重、稳定、可引用,不追求个人口语风格。它需要经过神学审查、外交审核、翻译润色,最终呈现出来的是一种高度打磨、情绪克制、句式规整的"平滑正式文"。
而大模型最擅长的,恰好就是这种文体。
人写得太像机器,机器写得太像人,检测器在中间越来越难分辨。
这不是教皇独有的困境。任何经过多人协作、反复润色的正式公文——大学声明、企业年报、政策文件——都面临同样的风险。Turnitin和GPTZero在筛查学生作业时,非英语母语写作者和经过语法软件润色的文章,一直存在高误报率。
真正被考验的是什么?
如果教皇通谕的写作过程确实借助了AI工具,那问题来了:
这是错的吗?
通谕的核心论点——AI时代需要保护人类尊严、警惕权力集中、确保关键决策由人类做出——会因为写作过程中用了AI而失效吗?
大概率不会。论点的价值在于逻辑和证据,而不在于执笔者的碳基或硅基身份。
但信任会受损。
这才是这件事最深层的影响。
当一份42000字的正式文件,主题是"AI时代的信任危机",而它自己就卷入了"是否由AI撰写"的信任争议——这已经不是一个技术问题,而是一个元问题。
它拷问的是:在AI时代,我们还能信任什么?
一篇学术论文的真实性? 一份企业声明的原始性? 一个政策文件的独创性?
过去,我们通过签名、盖章、机构背书来建立信任。AI检测器试图提供一种新的信任机制——算法验证。但这次事件说明,这种机制本身就不够可靠。
ic.work的文章提出了一个很实际的建议:高关注度的公共文本发布方,可能需要开始保留写作流程的版本记录、审稿链路,甚至主动说明是否使用了自动化工具。
这听起来很繁琐,但可能就是2026年以后的新常态。
一个没有结论的结尾
回到最初的问题:教皇到底用没用AI写通谕?
我们不知道。
AI检测器的结果只能说明"文本存在异常信号",不能证明"教皇或梵蒂冈使用了AI"。同样,梵蒂冈的沉默也不能被解读为"默认"。
真正有意思的,也许不是答案本身,而是这个问题被提出来的方式——
一份教皇通谕,在发布后24小时内,被一个论坛帖子、一款检测工具和一个媒体记者,共同推上了全球科技头条。
放在十年前,这不可想象。没有人会用算法去检测教皇的写作。没有人会觉得这个问题值得问。
现在值得了。
也许教皇在通谕里写的那些关于AI的警告,最精确的注脚,就是他自己的这份通谕所引发的争议。
AI的危险,从来不只是它做了什么,更是它让我们无法确定"谁"做了什么。
这不正是教皇想说的吗?
参考来源:The Verge、LessWrong (Linch Zhang)、ic.work (沈砚)
夜雨聆风