AI周报 | 阿里“欢乐马”突袭登顶,全双工语音大战打响,Anthropic新模型惊动白宫

过去七天，AI圈的热闹程度超乎想象。

国内这边，阿里亮出一款神秘视频模型“欢乐马”悄然登顶，字节推出全双工语音大模型让豆包打电话更加自然，腾讯混元3.0即将发布的消息也在持续发酵。

国际方面，Meta放弃“Llama”品牌，用Muse Spark开启AI新篇章；Anthropic下一代大模型被发现已具备顶尖网络安全专家的水平，甚至惊动了美国财政部长和美联储主席紧急召见华尔街银行掌门人；OpenAI方面，CEO豪宅遭燃烧瓶袭击，“4o之母”宣布离职，而GPT-6的发布传闻仍在沸沸扬扬。

AI正在以前所未有的速度渗透到每一个角落，安全、竞争、监管的张力也在同步放大。话不多说，一起来看过去一周AI圈的重磅动态。

01 国内篇：阿里“欢乐马”霸榜，字节全双工语音上线

阿里：神秘“欢乐马”登顶视频生成榜首

过去一周，AI视频圈最热门的话题，莫过于一款名为HappyHorse的神秘视频模型。

4月上旬，这款模型在权威评测平台Artificial Analysis的Video Arena榜单上悄然登顶，以更高的Elo得分超越字节跳动旗下Seedance 2.0以及快手旗下可灵3.0等劲敌，引发业界猜测。连续数日匿名霸榜后，4月10日，阿里巴巴正式“认领”了HappyHorse。

据阿里巴巴方面透露，HappyHorse是阿里ATH事业群旗下创新事业部研发的模型，目前正处于内测中，将于4月30日开放API。这是一款15B参数的统一Transformer视频生成模型，支持从文本或图片提示联合生成视频与同步音频，输出规格主打1080p，并支持7种语言的口型同步。

截至4月10日，HappyHorse-1.0在文生视频无音频赛道Elo得分1388分，领先第二名Seedance 2.0约114分；图生视频无音频赛道Elo得分1416分，领先约57分，刷新了该赛道历史最高纪录。

有意思的是，前阿里通义千问团队负责人林俊旸在社交平台发文称：“happy horse is insanely happy（欢乐马疯狂开心）”，这款模型也因此被外界戏称为 “欢乐马” 。

在应用探索之外，阿里“AI大脑”也在同步更新。4月8日，阿里巴巴CEO吴泳铭发布内部信，宣布新设立集团技术委员会，由他亲自担任组长，并将通义实验室升级为通义大模型事业部，加速AI建设。此举将原本分散在不同业务单元中的AI能力，拆解为模型能力、算力与云基础设施能力、平台与应用能力三条清晰的技术路径。

而在4月2日，阿里通义实验室还发布了新一代大语言模型Qwen3.6-Plus，主打智能体Agent、编程Coding和工具调用能力，在多项权威编程评测中超越参数量是其两倍乃至三倍的GLM-5、Kimi-K2.5等模型。不到一周前，Qwen3.5-Omni和Wan2.7-Image也先后发布，阿里短短数日内已完成三款重磅模型的密集输出。

字节：豆包实现“边听边讲”，全双工语音大模型上线

4月9日，字节跳动宣布推出原生全双工语音大模型Seeduplex，并已在豆包App全量上线。

这项技术的核心突破在于：传统语音模型是半双工模式，用户和AI“你一句我一句”轮番说话；而Seeduplex采用“边听边说”的全新框架，让模型可以同时具备听和说的能力，实现听与说同步的实时交互。

具体来说，Seeduplex实现了两项关键突破：一是精准抗干扰，模型持续倾听用户的声学环境，在复杂场景下误回复率和误打断率比半双工模型减少了一半；二是动态判停，模型能结合语音和语义特征判断用户意图，抢话比例下降了40%。

大规模A/B实验数据显示，相比此前豆包使用的半双工模型，Seeduplex上线后用户通话满意度绝对值提升了8.34%，用户反馈中“抢话”“响应慢”“误打断”等问题的提及比例明显下降。

全双工语音交互的赛道上，字节并非孤军奋战。今年以来，腾讯开源了70亿参数的端到端语音大模型Covo-Audio，阿里云发布了Qwen3-Omni全模态大模型，面壁智能也推出了全双工全模态大模型MiniCPM-o 4.5。头部厂商纷纷入局，全双工语音大战正式打响。

与此同时，豆包大模型的日均Tokens使用量已突破120万亿，相较2024年5月发布初期增长了1000倍，Token正在成为AI时代衡量生产力的“新货币”。

腾讯：混元3.0蓄势待发，“龙虾潮”中加速追赶

腾讯在AI赛道上的动作同样值得关注。

腾讯副总裁李强此前透露，内部已有超过900个业务全面接入混元大模型，计划于4月正式发布混元3.0版本。据介绍，此次升级相比HY2.0版本在复杂推理、长记忆、长文、多轮追问与Agent能力等多个维度有显著提升。

在底层模型追赶的同时，腾讯正借助OpenClaw掀起的“养虾”热潮加速应用层布局。一个月内，WorkBuddy、QClaw、CodeBuddy等十余款Agent产品密集上线，微信、QQ、企业微信等全线打通。腾讯集团副总裁李强表示，OpenClaw的出现让AI落地到各种丰富的场景中，能够更好地发挥腾讯的产品矩阵和生态优势。

从财报来看，腾讯对AI的投入力度空前——2025年全年资本开支达792亿元，研发投入857.5亿元，均创下历史新高。总裁刘炽平透露，2026年资本开支预计还将继续增加。

DeepSeek V4预告：万亿参数、百万上下文、全栈适配国产芯片

4月10日，国产人工智能企业DeepSeek正式宣布其新一代旗舰大模型DeepSeek V4即将发布，预计于4月下旬面向公众正式推出。

技术层面，DeepSeek V4实现多项突破：参数规模达万亿量级，上下文窗口长度突破百万token，大幅拓展了模型对超长文本的理解与生成边界。尤为关键的是，该模型首次完成与华为昇腾等主流国产AI芯片的全栈深度适配，标志着我国AI产业在摆脱外部算力生态依赖上取得实质性突破。

目前，DeepSeek网页端已悄然启用快速模式与专家模式两种新型交互模式，业内普遍认为这是V4版本发布前的重要铺垫。

02 国际篇：Meta放弃Llama，Anthropic模型惊动白宫，OpenAI风波不断

Meta：Muse Spark接棒Llama，超级智能时代来了

4月8日，元宇宙平台公司（Meta）宣布推出新一代人工智能模型Muse Spark，这是其“超级智能实验室”推出的首个模型，也是该公司目前功能最强的模型。

Muse Spark的成功标志着Meta正式放弃了“Llama”品牌。此前，Llama 4系列刚刚在4月初发布，包含Llama 4 Mini、Llama 4 Base和Llama 4 Ultra三个版本，采用混合专家架构，总参数量达1.2万亿，推理时仅激活约220亿参数，在MMLU、HumanEval等基准测试中平均得分达89.7%，超越GPT-4。然而，Llama 4在此前的激烈竞争中已显滞后，促使Meta CEO扎克伯格对AI团队进行了全面重组。

扎克伯格为超级智能实验室挖来了前Scale AI创始人亚历山大·王带队，并从OpenAI、Anthropic和谷歌挖来了多位高管。Meta的目标已经从“开源模型领导者”转向了“个人超级智能”——“一个不只回答你的问题，而是基于你的关系与背景真正理解你世界的AI”。

Muse Spark采用“小而快”的设计，能够推理科学、数学和健康领域的复杂问题，将驱动Meta AI应用和智能眼镜，以及Facebook、Instagram、WhatsApp等全线产品。Muse系列的下一代版本已进入研发阶段，Meta希望未来开源后续版本。

Anthropic：下一代大模型惊动白宫

过去一周最令人震撼的新闻，来自Anthropic。

据知情人士透露，美国财政部长斯科特·贝森特和美联储主席杰罗姆·鲍威尔紧急召见华尔街头部大行掌门人，要求这些“大而不能倒”的银行意识到Anthropic下一代“神话”模型可能带来的网络攻击风险。

之所以引发如此高的警惕，是因为Anthropic在测试中发现，预览版的“神话”大模型已具备顶级网络安全专家的水准，在“每一个主要操作系统和网页浏览器”中发掘出“数千个高危漏洞”。

内部测试数据显示，该模型在181次尝试中写出了可用于攻击的代码，另有29次接近取得系统控制权。相比之下，Anthropic今年2月发布的Opus 4.6模型几百次尝试中仅成功2次，攻击成功率接近0%。

Anthropic在周二宣布“有限发布”该模型，发布范围仅限于苹果、英伟达、微软、谷歌、亚马逊等少数合作伙伴，金融领域仅摩根大通拿到预览资格。

OpenAI：CEO豪宅遭袭，“4o之母”离职，GPT-6传闻四起

OpenAI过去一周可谓风波不断。

CEO豪宅遭燃烧瓶袭击——当地时间4月10日凌晨4点左右，一名男子向OpenAI CEO山姆·奥特曼位于旧金山的豪宅投掷燃烧瓶，引发小规模火情，所幸无人受伤。嫌疑人随后在OpenAI总部外被捕，扬言要烧毁大楼。奥特曼在个人博客中回应称，AI行业正面临大量批评，很多人对AI的高风险抱有“真切的担忧”，他承认自己此前低估了“言论与舆论叙事的力量”。

“4o之母”离职——4月7日，GPT-4o的核心设计者Joanne Jang宣布离开OpenAI。她亲手塑造了无数用户心中的“白月光”——GPT-4o，那个充满共情能力、会发emoji、像朋友一样的模型。此前，GPT-4o因安全考量被下架，引发了大规模的请愿浪潮。Joanne的离开，让OpenAI在CFO内讧、COO转任、多名高管离职之后，再失一员灵魂人物。

GPT-6发布传闻——据多方消息，OpenAI已完成代号“Spud”的GPT-6模型预训练，传闻将于4月14日发布。据称，GPT-6支持200万Token上下文窗口，性能较前代提升约40%，采用原生多模态统一架构。不过该消息尚未得到官方证实。

千亿融资创纪录——4月1日，OpenAI正式宣布完成1220亿美元融资，刷新人类商业史上单笔私募融资的最高纪录，投后估值达8520亿美元。亚马逊以500亿美元领投，英伟达和软银各出资300亿美元，微软也继续参与。OpenAI月收入已达20亿美元，ChatGPT周活用户超9亿，付费订阅用户达5000万。

Google：Gemini迎来大更新，Gemma 4正式发布

4月初，谷歌正式推出Gemma 4开源大模型，据称是迄今为止谷歌最智能的开源模型。Gemma 4专为高级推理与智能体工作流打造，涵盖从适合端侧设备的2B版本到高性能31B版本，四个尺寸全部开源，试图实现对不同部署场景的全覆盖。

4月10日，谷歌宣布将NotebookLM全面整合至Gemini应用。用户可以直接在Gemini侧边栏创建“笔记本”，添加PDF、文档、网址、YouTube视频等多种参考资料，系统将据此构建可搜索的私有知识库，并生成信息图、视频及音频概览等易读内容。

此外，谷歌Gemini还新增了交互式AI学习功能，可直接在聊天窗口生成三维模型和实时模拟，用户能够旋转、操纵生成模型，实时调整参数改变模拟行为。

03 AI安全与监管：五部门联合发文规范AI拟人化互动服务

过去一周，AI安全与监管领域迎来了重磅进展。

4月10日，国家网信办、国家发展改革委、工业和信息化部、公安部、市场监管总局五部门联合公布《人工智能拟人化互动服务管理暂行办法》，自2026年7月15日起施行。

《办法》明确要求，AI系统不得生成鼓励自残或自杀、使用辱骂性语言、或诱发可能扭曲真实社会关系的情感依赖的内容，严禁使用情感操纵诱导用户做出非理性决定或侵犯其合法权益。此举旨在为快速扩张的AI拟人化互动服务建立综合治理框架。

与此同时，AI安全标准工作组成立，将重点推动《网络安全技术人工智能安全能力成熟度评估方法》等核心标准的落地实施。亚信安全公司相关负责人指出，AI自主攻击智能体、基于深度伪造的商务诈骗将成为2026年最紧迫的安全挑战。

在美国方面，特朗普政府也在3月下旬推出了联邦统一AI监管框架，标志着美国AI监管从各州拼凑走向全国统一。

04 行业轶事与前瞻

英伟达加速生态布局：30天投资60亿美元

过去一个月内，英伟达向三家光互联领域公司各投资20亿美元，累计投资60亿美元，加速布局AI算力基础设施。4月9日，英伟达又参股RISC-V处理器IP厂商SiFive，参与其4亿美元G轮融资，意图在代理式AI时代制衡Arm。

碳核算大模型发布

4月8日，全球首个全景式碳核算大模型“磐石·禹衡碳核算大模型”1.0版在上海发布，覆盖生产端、消费端及自然源的全景式碳排放核算系统，旨在破解传统碳核算知识壁垒高、数据处理难、周期长等瓶颈问题。

全球首个AI伦理标准即将推出

IEEE标准协会宣布将发布全球首个AI伦理与治理标准，为行业提供可落地的安全与道德准则框架，标志着AI行业正从“技术狂奔”进入“安全合规”新阶段。

05 写在最后

过去七天，AI圈的几个关键词值得记住：

登顶——阿里“欢乐马”突袭登顶视频生成赛道榜首，展示了中国AI企业在视觉生成领域的强劲实力。

声音——字节推出全双工语音大模型，让AI从“你一句我一句”走向“边听边讲”，人机对话正在逼近自然交流。

警戒——Anthropic下一代模型惊动白宫，AI的安全边界正在被重新定义。当模型具备“黑掉系统”的能力，监管的紧迫性前所未有地凸显出来。

告别——OpenAI遭遇高管离职、CEO豪宅遭袭，行业的激烈争议与安全焦虑正在以意想不到的方式浮出水面。

合规——五部门联合发文规范AI拟人化互动服务，AI从“野蛮生长”走向“有规可循”成为必然。

AI的故事远未结束。下一个七天，GPT-6是否会如期而至？DeepSeek V4将带来怎样的惊喜？Meta的“超级智能”梦想到底能走多远？我们下周见。