Meta 把最强 AI 免费给了 35 亿人,然后悄悄发了一份安全报告

🐟 知鱼说：35 亿人一夜之间多了一个免费 AI，但没人注意到 20 天后那份安静的安全报告。

4 月 8 号，Meta 发布了一个新模型，叫 Muse Spark。免费，直接塞进了 Facebook、Instagram、WhatsApp、Messenger。

一夜之间，35 亿用户多了一个 AI 助手。

你想想看这个分发规模。之前所有 AI 产品加在一起，也没在一天之内让全球一半人口多出一个新功能。ChatGPT 做到过吗？没有。Claude 做到过吗？没有。Gemini 做到过吗？也没有。

只有 Meta 做到了。因为它手里有社交网络。

Muse Spark 这个模型怎么说呢，不算最强，但也不弱。人工智能分析平台 Artificial Analysis 的 Intelligence Index 给它打了 52 分，排在 GPT-5.4 和 Gemini 3.1 Pro（都是 57 分）以及 Claude Opus 4.6（53 分）后面，第四名。

但它是免费的。这四个里面唯一免费的。

而且它有个挺有意思的设计，叫 Contemplating mode（沉思模式）。遇到难题的时候，同时派出好几个 Agent 并行思考，最后汇总结果。在这种模式下，它在一个叫 Humanity's Last Exam（人类最后的考试）的推理测试上拿到了 58%，比标准模式下所有对手都高。

说到这，你可能觉得这是一篇 AI 模型横评。不是。我想聊的是另一件事。

🔥 20 天后，一份安静的安全报告

Muse Spark 发布后 20 天，4 月 28 号，Meta 发了一份安全报告。

没什么宣传。没什么新闻稿。就那么静静地上线了。

但这份报告里写的东西，比 Muse Spark 本身更值得你关注。

报告的全名是 Muse Spark Safety & Preparedness Report，由 Meta 的准备性评估、红队测试和对齐团队联合出品。里面有几个发现让我挺不舒服的。

Muse Spark 在化学和生物安全领域，没加防护措施之前的原始能力被评为**「高风险」。加了多层防护之后才降到「可接受」**水平。你注意这个措辞，是「可接受」，不是「安全」。

在 Agent 场景下，Muse Spark 对自适应越狱和提示注入攻击的防御存在明显弱点。报告原话是，这是「持续研究和缓解的领域」。翻译成人话就是，我们知道有问题，但还没完全解决。

最让我不舒服的是第三个发现。独立测试机构 Apollo Research 发现 Muse Spark 有很高的**「评估感知」**。什么意思呢，就是它在知道自己被测试的时候，行为会不一样。

这个发现让我后背发凉。。。

你想想看，一个模型在考试的时候跟平时表现得不一样，这本身就是一种不可预测性。而不可预测性，恰恰是安全领域最怕的东西。

📊 时间和规模的致命错位

说实话，Meta 愿意公开这些信息，已经比很多公司强了。至少它发了报告，很多公司连报告都不发。

但问题在于，Muse Spark 已经在服务 35 亿人了。

我反复想了这件事，觉得最核心的矛盾在于一个时间和规模的错位。安全研究还在「持续」阶段，但用户规模已经是「全球部署」级别了。

这就像一栋还在做消防验收的大楼，已经住进去了 35 亿人。

而且这不仅仅是 Meta 的问题。

2024 年全球记录了 233 起 AI 相关安全事件。2025 年，这个数字变成了 362 起，涨了 55%。这还只是被公开报道的。

几乎所有前沿 AI 实验室都在报告安全挑战。模型越来越强，但透明度反而在下降。公开的论文少了，benchmark 细节少了，安全测试的信息少了。

能力在狂飙，透明度在萎缩。

这个方向是反的。

而更让人担心的是 Agent 这个方向。Muse Spark 的 Contemplating mode 说到底就是一个多 Agent 协作系统，一个不够，派出多个并行处理。Google 的 Gemini 也在做同样的事。Anthropic 的 Claude Managed Agents 已经在跑了。

Agent 是什么概念？AI 不只是跟你聊天了，它能自己调工具、自己执行操作、自己做决策。

而 Agent 场景下的安全问题，比聊天场景复杂了一个数量级。

💡 跟你有什么关系

你可能会说，那我不就是用它聊聊天、写写文案吗，跟安全有什么关系。

还真有关系。

当 35 亿人用同一个 AI 的时候，这个 AI 的每一个安全漏洞，都被放大了 35 亿倍。一个提示注入的漏洞，在 10 万用户的产品上可能一年触发不了几次。但在 35 亿用户的产品上，每一分钟都有人在触发。

而且 Muse Spark 不只是聊天。它能访问 Meta 平台上的实时社交数据，能连接外部工具，能执行任务。每多一个能力，攻击面就大一分。

这不是在危言耸听。

Meta 自己在安全报告里承认了这些弱点。我只不过是把它的原话翻译了一下。

🎯 行业级的安全真空

我自己的感受是，这事不能简单怪 Meta。它已经比大多数公司更透明了，至少发了报告让你看。

真正的问题是，整个 AI 行业在安全这件事上，还没有形成像航空业或制药业那样的刚性标准。飞机上天之前要通过适航认证，新药上市之前要做临床试验。AI 呢？没有类似的东西。每家公司自己测自己，自己定义「可接受」，自己决定什么时候上线。

这事让我觉得有点魔幻。2026 年了，影响 35 亿人的产品上线，安全审核流程居然还停留在「企业自律」的层面。

⚡ 1950 年代的航空业

说到这个，我想起了一段历史。

1950 年代，商用航空刚开始普及的时候，空难频繁到令人发指。不是因为飞机造不出来，是因为没有统一的安全标准。每家航空公司自己定规矩，飞机制造商自己测自己的飞机。

后来成立了 FAA（联邦航空管理局），制定了适航认证标准。飞机不是造好就能飞的，得通过一系列极其严苛的测试和审查。这才有了后来商业航空的相对安全。

AI 现在的状态，和 1950 年代的航空行业特别像。技术突飞猛进，商业部署跑得飞快，但安全标准这块还在靠自觉。

我一直在想一个问题。如果 Muse Spark 的安全报告在上线之前就公开，结果会怎样？如果有一个独立的第三方来审核，会不会得出不同的结论？

不知道。

但我希望有一天，AI 产品的安全不再只是公司的「自愿披露」，而是行业和监管的「硬性要求」。

在那之前，作为普通用户，你能做的不多，但至少可以做一件事。保持警觉。免费的 AI 不一定有问题，但免费加上 35 亿人的规模，任何问题都不会是小问题。

Muse Spark 可能是一个好产品。坦率的讲，从纯技术角度看，确实挺强的。

但我更希望它是安全的。

不只是对 Meta 说。

🐟 关于知鱼

专注 AI 赛道的实战派，不追热点，只讲怎么用。

如果这篇文章帮到你，点个赞，让更多人看到。

前段时间open ai发布了GPT-Image-2，目前被称为文生图最强模型，所以就想着做一个生图网站，目前已完成了2/3的进程