OpenAI联手Google筑起AI水印高墙同一天开源工具325分登顶HN轻松拆墙猫鼠大战全面升级

5 月 19 号，同一天，发生了两件事。

第一件。OpenAI 宣布采用 Google 的 SynthID 水印技术。两家 AI 巨头联手，要给 AI 生成的图片打上「隐形身份证」。截图、缩放、加滤镜，都洗不掉。

第二件。一个叫 Remove-AI-Watermarks 的开源工具，在 Hacker News 上以 325 分登上热榜。它的功能就一个，把 AI 水印全部去掉。支持 Google、OpenAI、Stable Diffusion、Adobe Firefly、Midjourney。

前脚筑墙。后脚拆墙。

同一天。

我当时就觉得，这个剧情也太魔幻了。

先说说 OpenAI 这边做了什么。

他们做了两件事。第一件是采用了 C2PA 元数据标准。你可以理解为给每张 AI 生成的图片贴了个「出生证明」，里面写着谁生成的、用什么模型、什么时候生成的。第二件是接入了 Google 的 SynthID 隐形水印。

这两个东西的区别是，C2PA 元数据就像是贴在图片外面的标签，你可以看到，也可以撕掉。而 SynthID 是刻在图片像素里的暗纹，肉眼完全看不出来，但机器能读出来。

OpenAI 的官方说法是，「水印在经过截图等变换时更持久，而元数据能提供更多信息。两层防护叠加，比任何单一方案都更可靠。」

说得很好听。

但问题来了。

同一天登上 HN 热榜的那个工具叫 Remove-AI-Watermarks。作者是一个叫 wiltodelta 的 GitHub 用户。MIT 开源协议。现在已经 1k星了。

这个工具做了三件事。

第一件，去掉可见水印。Google Gemini 生成的图片上有个小水印标记，它用了一个 NCC（归一化互相关）检测器找到水印位置，然后反向还原。处理一张图大概 0.05 秒，不需要 GPU。

0.05 秒。你眨个眼的功夫，水印就没了。

第二件，去掉隐形水印，包括 SynthID。这一步的技术含量最高。它不是传统意义上的「破解」水印算法，而是用了一种更暴力也更聪明的方法，扩散模型重生成。

具体来说，先把图片编码到潜空间（就是 AI 模型内部的数学表示），加一轮受控的正向扩散（往图片里加噪点），然后再反向去噪。大概 50 步。

这一步的逻辑是，SynthID 的水印信号藏在像素级的噪点模式里。扩散模型重生成的过程会彻底打乱这些噪点模式，同时保留图片的视觉内容。相当于把一栋房子拆了重建，外观一模一样，但墙里的暗号全换了。

第三件，去掉元数据。EXIF 标签、XMP 标记、PNG 文本块、C2PA 凭证，全部清掉。

三种水印，三层防护，一层一层给你剥干净。

坦率的讲，看到这个工具的原理时，我有一种似曾相识的感觉。

十几年前，数字音乐行业花了几十亿美元搞 DRM（数字版权管理）。每首歌都加密，每台设备都认证，每份拷贝都追踪。结果呢？一个十几岁的孩子用一条音频线从声卡录一遍，所有加密就都没了。

电影行业也是。蓝光光盘的 AACS 加密被破解之后，好莱坞又搞了 BD+，又被破解了。再搞 Cinavia 音频水印，结果呢？有人写了工具专门过滤掉那个频段。

历史一次又一次地证明了一件事。

防守方和攻击方之间，存在一个根本性的不对称。

防守方的水印必须在所有合法操作下都存活，截图、压缩、裁剪、加滤镜、打印再拍照。攻击方只需要找到一个水印扛不住的操作就行了。

而 Remove-AI-Watermarks 的方法更绝。它根本不跟水印算法正面较量。它用扩散模型重新生成一张图，外观几乎一样，但底层的像素数据已经完全不同。水印信号在重生成的过程中自然就消失了。

这就像你想在水面上写字。你写得再隐蔽，别人把水搅一搅，字就没了。水面还是那个水面，但你的字没了。

说到这里，得聊聊 SynthID 到底是怎么工作的。

Google 在 2024 年把 SynthID 的研究发在了 Nature 上。对，就是那个顶级科学期刊。可见他们对这个技术的重视程度。

原理大概是这样的。AI 模型在生成图片的时候，会在潜空间（模型内部的数学空间）里嵌入一个特定的信号模式。这个信号在图片生成的过程中被编织进了像素里，但人眼完全看不出来。经过截图、压缩、加滤镜这些常见操作，信号还能保持一定的可检测性。

Google 的说法是，SynthID 可以抗住裁剪、滤镜、帧率变化、有损压缩这些操作。

但 Remove-AI-Watermarks 的文档里有一句话挺有意思的。它说，「如果原始水印文件曾经经过提示发起者控制的系统，Google 保留将该原始文件与生成账户关联的能力。」

翻译一下，就是说，就算你去掉了水印，Google 可能还是知道这张图是你生成的。因为他们有原始记录。

但问题是，真的有那么多人在乎 Google 知不知道吗？

从更大的格局看，AI 内容溯源这个事情，现在大概有四种路线。

第一种是元数据路线，就是 C2PA 那套。在文件里写信息。优点是简单，缺点是谁都能删。

第二种是像素级隐形水印，就是 SynthID。藏在图片的噪点里。比元数据难搞，但扩散模型可以绕过。

第三种是模型内嵌水印，比如 Meta 的 StableSignature。在模型生成图片的过程中就写进去。比外部水印更难去，但还是有办法绕。

第四种是潜空间水印，比如 TreeRing。在模型的内部表示里做标记。理论上最难去，但刚才那个工具的文档里写着也支持了。

四种路线，全军覆没。

当然，这么说有点绝对。Remove-AI-Watermarks 自己也承认，对 SynthID v2 的去除效果是基于手动验证的，还没有自动化回归测试。AVIF、HEIF、JPEG-XL 这些格式也没完全覆盖。

但方向已经很清楚了。只要有人想去除，就一定能找到办法。

我有时候想，这件事的根源是什么。

说到底，AI 生成内容的水印和当年的音乐 DRM 面对的是同一个问题，你没办法在不损害用户体验的前提下做到绝对安全。

音乐 DRM 的死因是，正版用户觉得麻烦，盗版用户毫无影响。最后唱片公司放弃了 DRM，iTunes 卖无 DRM 的音乐，反而赚了更多钱。

AI 水印会不会走同一条路？

有一个细节值得注意。欧盟的 AI 法案要求 AI 生成内容必须标注来源，但标注义务推迟到了 2026 年 12 月才生效。中国的深度合成规定更早，2023 年 1 月就生效了，要求 AI 生成内容同时有可见和隐形标记。美国联邦法律规定，以欺骗目的去除内容来源标识是违法的。

法律在收紧。技术在松动。

OpenAI 和 Google 联手筑墙这件事本身，说明行业已经意识到了问题的严重性。但墙筑得越高，拆墙的工具就越厉害。

这个猫鼠游戏不会停。

回到文章开头的那个画面。

5 月 19 号，同一个下午。OpenAI 的工程师在发布博客，宣布 SynthID 合作。另一边，一个 GitHub 用户的开源项目在 Hacker News 上疯狂涨粉。

两拨人在同一天，做着完全相反的事。

一个在说「我们找到了解决方案」。另一个在说「你的方案我刚破解了」。

我看到这个画面的时候，脑子里冒出的是一个不太恰当的类比。

有点像中世纪的城堡攻防战。守城方发明了更高的城墙，攻城方就造了更长的梯子。守城方倒热油，攻城方就造了铁皮顶棚。你来我往，永无止境。

不同的是，这次攻城方不需要自己造梯子。他把梯子的图纸开源了，全世界任何人都可以造。

1k星。MIT 协议。拿来就能用。

AI 水印的未来会怎样，我不知道。但我知道一件事。

在这个行业里，每当你觉得自己找到了一个「解决方案」的时候，大概率有人正在写一个让这个方案失效的工具。

而且他们可能比你更快。

看到这里了，觉得不错就点个赞、在看、转发三连吧～想第一时间收到推送，给我个星标⭐。感谢你看我的文章，下次见。