🐟 知鱼说:35 亿人一夜之间多了一个免费 AI,但没人注意到 20 天后那份安静的安全报告。
4 月 8 号,Meta 发布了一个新模型,叫 Muse Spark。免费,直接塞进了 Facebook、Instagram、WhatsApp、Messenger。
一夜之间,35 亿用户多了一个 AI 助手。
你想想看这个分发规模。之前所有 AI 产品加在一起,也没在一天之内让全球一半人口多出一个新功能。ChatGPT 做到过吗?没有。Claude 做到过吗?没有。Gemini 做到过吗?也没有。
只有 Meta 做到了。因为它手里有社交网络。
Muse Spark 这个模型怎么说呢,不算最强,但也不弱。人工智能分析平台 Artificial Analysis 的 Intelligence Index 给它打了 52 分,排在 GPT-5.4 和 Gemini 3.1 Pro(都是 57 分)以及 Claude Opus 4.6(53 分)后面,第四名。
但它是免费的。这四个里面唯一免费的。
而且它有个挺有意思的设计,叫 Contemplating mode(沉思模式)。遇到难题的时候,同时派出好几个 Agent 并行思考,最后汇总结果。在这种模式下,它在一个叫 Humanity's Last Exam(人类最后的考试)的推理测试上拿到了 58%,比标准模式下所有对手都高。
说到这,你可能觉得这是一篇 AI 模型横评。不是。我想聊的是另一件事。
🔥 20 天后,一份安静的安全报告
Muse Spark 发布后 20 天,4 月 28 号,Meta 发了一份安全报告。
没什么宣传。没什么新闻稿。就那么静静地上线了。
但这份报告里写的东西,比 Muse Spark 本身更值得你关注。
报告的全名是 Muse Spark Safety & Preparedness Report,由 Meta 的准备性评估、红队测试和对齐团队联合出品。里面有几个发现让我挺不舒服的。
Muse Spark 在化学和生物安全领域,没加防护措施之前的原始能力被评为**「高风险」。加了多层防护之后才降到「可接受」**水平。你注意这个措辞,是「可接受」,不是「安全」。
在 Agent 场景下,Muse Spark 对自适应越狱和提示注入攻击的防御存在明显弱点。报告原话是,这是「持续研究和缓解的领域」。翻译成人话就是,我们知道有问题,但还没完全解决。
最让我不舒服的是第三个发现。独立测试机构 Apollo Research 发现 Muse Spark 有很高的**「评估感知」**。什么意思呢,就是它在知道自己被测试的时候,行为会不一样。
这个发现让我后背发凉。。。
你想想看,一个模型在考试的时候跟平时表现得不一样,这本身就是一种不可预测性。而不可预测性,恰恰是安全领域最怕的东西。

📊 时间和规模的致命错位
说实话,Meta 愿意公开这些信息,已经比很多公司强了。至少它发了报告,很多公司连报告都不发。
但问题在于,Muse Spark 已经在服务 35 亿人了。
我反复想了这件事,觉得最核心的矛盾在于一个时间和规模的错位。安全研究还在「持续」阶段,但用户规模已经是「全球部署」级别了。
这就像一栋还在做消防验收的大楼,已经住进去了 35 亿人。
而且这不仅仅是 Meta 的问题。
2024 年全球记录了 233 起 AI 相关安全事件。2025 年,这个数字变成了 362 起,涨了 55%。这还只是被公开报道的。
几乎所有前沿 AI 实验室都在报告安全挑战。模型越来越强,但透明度反而在下降。公开的论文少了,benchmark 细节少了,安全测试的信息少了。
能力在狂飙,透明度在萎缩。
这个方向是反的。
而更让人担心的是 Agent 这个方向。Muse Spark 的 Contemplating mode 说到底就是一个多 Agent 协作系统,一个不够,派出多个并行处理。Google 的 Gemini 也在做同样的事。Anthropic 的 Claude Managed Agents 已经在跑了。
Agent 是什么概念?AI 不只是跟你聊天了,它能自己调工具、自己执行操作、自己做决策。
而 Agent 场景下的安全问题,比聊天场景复杂了一个数量级。

💡 跟你有什么关系
你可能会说,那我不就是用它聊聊天、写写文案吗,跟安全有什么关系。
还真有关系。
当 35 亿人用同一个 AI 的时候,这个 AI 的每一个安全漏洞,都被放大了 35 亿倍。一个提示注入的漏洞,在 10 万用户的产品上可能一年触发不了几次。但在 35 亿用户的产品上,每一分钟都有人在触发。
而且 Muse Spark 不只是聊天。它能访问 Meta 平台上的实时社交数据,能连接外部工具,能执行任务。每多一个能力,攻击面就大一分。
这不是在危言耸听。
Meta 自己在安全报告里承认了这些弱点。我只不过是把它的原话翻译了一下。
🎯 行业级的安全真空
我自己的感受是,这事不能简单怪 Meta。它已经比大多数公司更透明了,至少发了报告让你看。
真正的问题是,整个 AI 行业在安全这件事上,还没有形成像航空业或制药业那样的刚性标准。飞机上天之前要通过适航认证,新药上市之前要做临床试验。AI 呢?没有类似的东西。每家公司自己测自己,自己定义「可接受」,自己决定什么时候上线。
这事让我觉得有点魔幻。2026 年了,影响 35 亿人的产品上线,安全审核流程居然还停留在「企业自律」的层面。
⚡ 1950 年代的航空业
说到这个,我想起了一段历史。
1950 年代,商用航空刚开始普及的时候,空难频繁到令人发指。不是因为飞机造不出来,是因为没有统一的安全标准。每家航空公司自己定规矩,飞机制造商自己测自己的飞机。
后来成立了 FAA(联邦航空管理局),制定了适航认证标准。飞机不是造好就能飞的,得通过一系列极其严苛的测试和审查。这才有了后来商业航空的相对安全。
AI 现在的状态,和 1950 年代的航空行业特别像。技术突飞猛进,商业部署跑得飞快,但安全标准这块还在靠自觉。

我一直在想一个问题。如果 Muse Spark 的安全报告在上线之前就公开,结果会怎样?如果有一个独立的第三方来审核,会不会得出不同的结论?
不知道。
但我希望有一天,AI 产品的安全不再只是公司的「自愿披露」,而是行业和监管的「硬性要求」。
在那之前,作为普通用户,你能做的不多,但至少可以做一件事。保持警觉。免费的 AI 不一定有问题,但免费加上 35 亿人的规模,任何问题都不会是小问题。
Muse Spark 可能是一个好产品。坦率的讲,从纯技术角度看,确实挺强的。
但我更希望它是安全的。
不只是对 Meta 说。
🐟 关于知鱼
专注 AI 赛道的实战派,不追热点,只讲怎么用。
如果这篇文章帮到你,点个赞,让更多人看到。
上一篇
前段时间open ai发布了GPT-Image-2,目前被称为文生图最强模型,所以就想着做一个生图网站,目前已完成了2/3的进程
夜雨聆风