2026年4月8日,美国元宇宙平台公司(Meta)正式推出新一代人工智能模型Muse Spark,这是其“超级智能实验室”(Meta Superintelligence Labs,简称MSL)成立以来发布的首个模型,也是该公司目前功能最强的模型。该模型主打原生多模态感知与复杂推理能力,支持处理多模态任务,并可与人工智能眼镜结合增强视觉理解能力。Muse Spark的发布,标志着Meta在经历Llama 4“刷分丑闻”和内部重组后,正式开启了AI战略的全新篇章。
一、发布概况:九个月“从零重建”,闭源路线重大转向
Muse Spark是Meta超级智能实验室自2025年6月成立以来推出的首款正式产品,也是Meta自去年重组AI团队以来发布的首款模型。该模型由Meta首席人工智能官、前Scale AI首席执行官Alexandr Wang领衔开发,内部代号为“牛油果”(Avocado)。Meta方面表示:“过去九个月,Meta超级智能实验室从零开始重建AI技术体系,开发速度超越以往任何周期。这款初始模型设计小巧、运行高效,却足以推演科学、数学与健康领域的复杂问题。”
与Meta此前发布的Llama系列模型不同,Muse Spark一改公司长期坚持的开源策略,采用闭源模式,即其设计和代码不会对外公开。目前用户可通过meta.ai网站及Meta AI应用程序使用该模型,API尚未全面开放,仅向少数合作伙伴提供私有预览版。Meta表示未来版本或将回归开源路线。
消息公布当日,Meta股价大涨6.50%,收于每股612.42美元,总市值达1.55万亿美元,市场反应颇为积极。Meta预计2026年AI相关资本支出将在1150亿美元至1350亿美元之间,最高位几乎是2025年支出(722亿美元)的两倍。
二、技术能力:原生多模态与“沉思”模式
Muse Spark是一款原生多模态推理模型,从底层设计上就整合视觉信息,而非后期拼接。这种架构使其具备“视觉思维链”能力,可在动态环境中进行标注、识别物体或通过并排视频分析纠正用户动作。在功能层面,Muse Spark支持工具调用、多智能体协同,并提供三级推理模式:
“即时”模式:快速响应简单查询;
“思考”模式:处理中等复杂度任务;
“沉思”模式:提供研究级深度推理,通过同时调度多个AI子代理进行并行推理,以更高效地处理复杂长链任务。
在计算效率方面,Muse Spark实现了显著突破。与上一代模型Llama 4 Maverick相比,Muse Spark达到相同能力所需算力不足后者的十分之一,实现了“少一个数量级以上”的算力效率提升。这一效率跃进来一种称为“思维压缩”的训练技术:在强化学习过程中,模型若花费过多思考时间会受到惩罚,迫使它在不牺牲准确度的前提下以更少的推理token解决复杂问题。
在基准测试表现方面,Muse Spark在多个领域展现出竞争力。在“人类最后的考试”任务中,沉思模式启用工具后取得58%的完成率,与GPT-5.4 Pro的58.7%基本持平;在前沿科学研究任务中取得38.3%,为几家头部模型中的最高分。在健康领域,Muse Spark与超过1000名医生合作整理训练数据,在开放式健康问答测试中取得42.8分,远超其他竞品。
不过,Muse Spark在编程能力方面仍存在短板。在智能体终端编程测试中,其得分低于Gemini 3.1 Pro和GPT-5.4等竞品,Meta高管也坦承“模型在编程方面略显不足”。独立评测机构Artificial Analysis的综合智能能力排名显示,Muse Spark位列全球第四,排在谷歌Gemini 3.1 Pro、OpenAI GPT-5.4和Claude Opus 4.6之后。
三、人工智能眼镜:视觉理解能力的延伸
Muse Spark特别强化了多模态感知能力,与Meta旗下人工智能眼镜结合后,相关视觉理解能力还将进一步增强。该模型已被整合至Meta AI应用程序中,通过增强的视觉理解能力,用户可借助人工智能眼镜实时识别和分析图片等视觉信息。
Meta将Muse Spark定位为“专为Meta产品体系深度定制”的模型。该模型目前已为美国地区的Meta AI应用及网站提供支持,未来数周内将扩展至WhatsApp、Instagram、Facebook、Messenger以及Meta智能眼镜。这一布局延续了Meta在硬件端持续投入AI能力的战略方向——2025年推出的第二代雷朋Meta智能眼镜已配备AI视觉识别功能,Muse Spark的接入将进一步提升眼镜的实时视觉理解与交互能力。
四、性能评价:部分领先,全面超越仍待时日
从市场表现看,Muse Spark的发布获得了资本市场的积极反馈,但业内人士普遍认为其在综合性能上尚未全面领先竞争对手。独立评测机构Vals AI首席执行官指出,Meta从Llama 4到Muse Spark实现了模型能力的显著提升,已具备竞争力,但编程能力仍是明显短板,预计将是Meta后续重点攻关的方向。Meta高管也承认,Muse Spark在某些方面的性能不及OpenAI的ChatGPT、Anthropic的Claude或谷歌的Gemini,但表示公司仍处于执行的早期阶段。
在第三方平台Artificial Analysis的综合智能能力排名上,Muse Spark列第四,前三名为谷歌Gemini 3.1 Pro、OpenAI GPT-5.4和Claude Opus 4.6。但值得注意的是,Meta此前的Llama 4 Maverick仅拿到18分,Muse Spark已跃升至52分,进步幅度相当显著。
五、产业意义:Meta AI战略的转折点
Muse Spark的发布对Meta而言具有多重战略意义。
首先,它是Meta AI战略转型的集中体现。2025年4月,Llama 4因基准测试成绩造假被曝光,旗舰项目Behemoth迟迟未能发布,开发者社区对Meta的信任遭受重创。随后,扎克伯格对AI组织进行全面重组,以143亿美元收购Scale AI 49%股权并挖来其创始人Alexandr Wang,组建超级智能实验室。Muse Spark正是这场豪赌的首张答卷。
其次,闭源转向预示着商业变现路径的探索。Muse Spark将以私有API形式对外提供服务,未来计划面向更广范围开发者提供付费API访问,探索商业化变现路径。同时,Meta AI聊天机器人将继续向用户免费开放,但公司正在考虑未来实行订阅收费模式。
再次,Muse Spark的推出标志着大模型产业竞争从参数规模比拼转向多模态感知与复杂推理能力的生态突围。Meta将Muse Spark定位为“个人超级智能”的第一步,面向Meta生态内30亿用户。这种以庞大用户生态为依托、以端侧硬件为延伸、以社交场景为切入的差异化路径,为Meta在AI竞赛中开辟了独特的发展空间。
六、未来展望:下一阶段已在研发中
Meta表示,Muse Spark只是Muse系列发展轨迹上的“早期数据节点”,下一代版本已在研发中。该公司希望未来开源后续版本,但当前仍将专注于通过API实现商业化落地。扎克伯格在社交媒体上表示:“我们计划持续发布更先进的模型,推动智能与能力的边界,包括新的开源模型。”
夜雨聆风