过去七天,AI圈的热闹程度超乎想象。
国内这边,阿里亮出一款神秘视频模型“欢乐马”悄然登顶,字节推出全双工语音大模型让豆包打电话更加自然,腾讯混元3.0即将发布的消息也在持续发酵。
国际方面,Meta放弃“Llama”品牌,用Muse Spark开启AI新篇章;Anthropic下一代大模型被发现已具备顶尖网络安全专家的水平,甚至惊动了美国财政部长和美联储主席紧急召见华尔街银行掌门人;OpenAI方面,CEO豪宅遭燃烧瓶袭击,“4o之母”宣布离职,而GPT-6的发布传闻仍在沸沸扬扬。
AI正在以前所未有的速度渗透到每一个角落,安全、竞争、监管的张力也在同步放大。话不多说,一起来看过去一周AI圈的重磅动态。
01 国内篇:阿里“欢乐马”霸榜,字节全双工语音上线

阿里:神秘“欢乐马”登顶视频生成榜首
过去一周,AI视频圈最热门的话题,莫过于一款名为HappyHorse的神秘视频模型。
4月上旬,这款模型在权威评测平台Artificial Analysis的Video Arena榜单上悄然登顶,以更高的Elo得分超越字节跳动旗下Seedance 2.0以及快手旗下可灵3.0等劲敌,引发业界猜测。连续数日匿名霸榜后,4月10日,阿里巴巴正式“认领”了HappyHorse。
据阿里巴巴方面透露,HappyHorse是阿里ATH事业群旗下创新事业部研发的模型,目前正处于内测中,将于4月30日开放API。这是一款15B参数的统一Transformer视频生成模型,支持从文本或图片提示联合生成视频与同步音频,输出规格主打1080p,并支持7种语言的口型同步。
截至4月10日,HappyHorse-1.0在文生视频无音频赛道Elo得分1388分,领先第二名Seedance 2.0约114分;图生视频无音频赛道Elo得分1416分,领先约57分,刷新了该赛道历史最高纪录。
有意思的是,前阿里通义千问团队负责人林俊旸在社交平台发文称:“happy horse is insanely happy(欢乐马疯狂开心)”,这款模型也因此被外界戏称为 “欢乐马” 。
在应用探索之外,阿里“AI大脑”也在同步更新。4月8日,阿里巴巴CEO吴泳铭发布内部信,宣布新设立集团技术委员会,由他亲自担任组长,并将通义实验室升级为通义大模型事业部,加速AI建设。此举将原本分散在不同业务单元中的AI能力,拆解为模型能力、算力与云基础设施能力、平台与应用能力三条清晰的技术路径。
而在4月2日,阿里通义实验室还发布了新一代大语言模型Qwen3.6-Plus,主打智能体Agent、编程Coding和工具调用能力,在多项权威编程评测中超越参数量是其两倍乃至三倍的GLM-5、Kimi-K2.5等模型。不到一周前,Qwen3.5-Omni和Wan2.7-Image也先后发布,阿里短短数日内已完成三款重磅模型的密集输出。
字节:豆包实现“边听边讲”,全双工语音大模型上线
4月9日,字节跳动宣布推出原生全双工语音大模型Seeduplex,并已在豆包App全量上线。
这项技术的核心突破在于:传统语音模型是半双工模式,用户和AI“你一句我一句”轮番说话;而Seeduplex采用“边听边说”的全新框架,让模型可以同时具备听和说的能力,实现听与说同步的实时交互。
具体来说,Seeduplex实现了两项关键突破:一是精准抗干扰,模型持续倾听用户的声学环境,在复杂场景下误回复率和误打断率比半双工模型减少了一半;二是动态判停,模型能结合语音和语义特征判断用户意图,抢话比例下降了40%。
大规模A/B实验数据显示,相比此前豆包使用的半双工模型,Seeduplex上线后用户通话满意度绝对值提升了8.34%,用户反馈中“抢话”“响应慢”“误打断”等问题的提及比例明显下降。
全双工语音交互的赛道上,字节并非孤军奋战。今年以来,腾讯开源了70亿参数的端到端语音大模型Covo-Audio,阿里云发布了Qwen3-Omni全模态大模型,面壁智能也推出了全双工全模态大模型MiniCPM-o 4.5。头部厂商纷纷入局,全双工语音大战正式打响。
与此同时,豆包大模型的日均Tokens使用量已突破120万亿,相较2024年5月发布初期增长了1000倍,Token正在成为AI时代衡量生产力的“新货币”。
腾讯:混元3.0蓄势待发,“龙虾潮”中加速追赶
腾讯在AI赛道上的动作同样值得关注。
腾讯副总裁李强此前透露,内部已有超过900个业务全面接入混元大模型,计划于4月正式发布混元3.0版本。据介绍,此次升级相比HY2.0版本在复杂推理、长记忆、长文、多轮追问与Agent能力等多个维度有显著提升。
在底层模型追赶的同时,腾讯正借助OpenClaw掀起的“养虾”热潮加速应用层布局。一个月内,WorkBuddy、QClaw、CodeBuddy等十余款Agent产品密集上线,微信、QQ、企业微信等全线打通。腾讯集团副总裁李强表示,OpenClaw的出现让AI落地到各种丰富的场景中,能够更好地发挥腾讯的产品矩阵和生态优势。
从财报来看,腾讯对AI的投入力度空前——2025年全年资本开支达792亿元,研发投入857.5亿元,均创下历史新高。总裁刘炽平透露,2026年资本开支预计还将继续增加。
DeepSeek V4预告:万亿参数、百万上下文、全栈适配国产芯片
4月10日,国产人工智能企业DeepSeek正式宣布其新一代旗舰大模型DeepSeek V4即将发布,预计于4月下旬面向公众正式推出。
技术层面,DeepSeek V4实现多项突破:参数规模达万亿量级,上下文窗口长度突破百万token,大幅拓展了模型对超长文本的理解与生成边界。尤为关键的是,该模型首次完成与华为昇腾等主流国产AI芯片的全栈深度适配,标志着我国AI产业在摆脱外部算力生态依赖上取得实质性突破。
目前,DeepSeek网页端已悄然启用快速模式与专家模式两种新型交互模式,业内普遍认为这是V4版本发布前的重要铺垫。
02 国际篇:Meta放弃Llama,Anthropic模型惊动白宫,OpenAI风波不断
Meta:Muse Spark接棒Llama,超级智能时代来了
4月8日,元宇宙平台公司(Meta)宣布推出新一代人工智能模型Muse Spark,这是其“超级智能实验室”推出的首个模型,也是该公司目前功能最强的模型。
Muse Spark的成功标志着Meta正式放弃了“Llama”品牌。此前,Llama 4系列刚刚在4月初发布,包含Llama 4 Mini、Llama 4 Base和Llama 4 Ultra三个版本,采用混合专家架构,总参数量达1.2万亿,推理时仅激活约220亿参数,在MMLU、HumanEval等基准测试中平均得分达89.7%,超越GPT-4。然而,Llama 4在此前的激烈竞争中已显滞后,促使Meta CEO扎克伯格对AI团队进行了全面重组。
扎克伯格为超级智能实验室挖来了前Scale AI创始人亚历山大·王带队,并从OpenAI、Anthropic和谷歌挖来了多位高管。Meta的目标已经从“开源模型领导者”转向了“个人超级智能”——“一个不只回答你的问题,而是基于你的关系与背景真正理解你世界的AI”。
Muse Spark采用“小而快”的设计,能够推理科学、数学和健康领域的复杂问题,将驱动Meta AI应用和智能眼镜,以及Facebook、Instagram、WhatsApp等全线产品。Muse系列的下一代版本已进入研发阶段,Meta希望未来开源后续版本。
Anthropic:下一代大模型惊动白宫
过去一周最令人震撼的新闻,来自Anthropic。
据知情人士透露,美国财政部长斯科特·贝森特和美联储主席杰罗姆·鲍威尔紧急召见华尔街头部大行掌门人,要求这些“大而不能倒”的银行意识到Anthropic下一代“神话”模型可能带来的网络攻击风险。
之所以引发如此高的警惕,是因为Anthropic在测试中发现,预览版的“神话”大模型已具备顶级网络安全专家的水准,在“每一个主要操作系统和网页浏览器”中发掘出“数千个高危漏洞”。
内部测试数据显示,该模型在181次尝试中写出了可用于攻击的代码,另有29次接近取得系统控制权。相比之下,Anthropic今年2月发布的Opus 4.6模型几百次尝试中仅成功2次,攻击成功率接近0%。
Anthropic在周二宣布“有限发布”该模型,发布范围仅限于苹果、英伟达、微软、谷歌、亚马逊等少数合作伙伴,金融领域仅摩根大通拿到预览资格。
OpenAI:CEO豪宅遭袭,“4o之母”离职,GPT-6传闻四起
OpenAI过去一周可谓风波不断。
CEO豪宅遭燃烧瓶袭击——当地时间4月10日凌晨4点左右,一名男子向OpenAI CEO山姆·奥特曼位于旧金山的豪宅投掷燃烧瓶,引发小规模火情,所幸无人受伤。嫌疑人随后在OpenAI总部外被捕,扬言要烧毁大楼。奥特曼在个人博客中回应称,AI行业正面临大量批评,很多人对AI的高风险抱有“真切的担忧”,他承认自己此前低估了“言论与舆论叙事的力量”。
“4o之母”离职——4月7日,GPT-4o的核心设计者Joanne Jang宣布离开OpenAI。她亲手塑造了无数用户心中的“白月光”——GPT-4o,那个充满共情能力、会发emoji、像朋友一样的模型。此前,GPT-4o因安全考量被下架,引发了大规模的请愿浪潮。Joanne的离开,让OpenAI在CFO内讧、COO转任、多名高管离职之后,再失一员灵魂人物。
GPT-6发布传闻——据多方消息,OpenAI已完成代号“Spud”的GPT-6模型预训练,传闻将于4月14日发布。据称,GPT-6支持200万Token上下文窗口,性能较前代提升约40%,采用原生多模态统一架构。不过该消息尚未得到官方证实。
千亿融资创纪录——4月1日,OpenAI正式宣布完成1220亿美元融资,刷新人类商业史上单笔私募融资的最高纪录,投后估值达8520亿美元。亚马逊以500亿美元领投,英伟达和软银各出资300亿美元,微软也继续参与。OpenAI月收入已达20亿美元,ChatGPT周活用户超9亿,付费订阅用户达5000万。
Google:Gemini迎来大更新,Gemma 4正式发布
4月初,谷歌正式推出Gemma 4开源大模型,据称是迄今为止谷歌最智能的开源模型。Gemma 4专为高级推理与智能体工作流打造,涵盖从适合端侧设备的2B版本到高性能31B版本,四个尺寸全部开源,试图实现对不同部署场景的全覆盖。
4月10日,谷歌宣布将NotebookLM全面整合至Gemini应用。用户可以直接在Gemini侧边栏创建“笔记本”,添加PDF、文档、网址、YouTube视频等多种参考资料,系统将据此构建可搜索的私有知识库,并生成信息图、视频及音频概览等易读内容。
此外,谷歌Gemini还新增了交互式AI学习功能,可直接在聊天窗口生成三维模型和实时模拟,用户能够旋转、操纵生成模型,实时调整参数改变模拟行为。
03 AI安全与监管:五部门联合发文规范AI拟人化互动服务
过去一周,AI安全与监管领域迎来了重磅进展。
4月10日,国家网信办、国家发展改革委、工业和信息化部、公安部、市场监管总局五部门联合公布《人工智能拟人化互动服务管理暂行办法》,自2026年7月15日起施行。
《办法》明确要求,AI系统不得生成鼓励自残或自杀、使用辱骂性语言、或诱发可能扭曲真实社会关系的情感依赖的内容,严禁使用情感操纵诱导用户做出非理性决定或侵犯其合法权益。此举旨在为快速扩张的AI拟人化互动服务建立综合治理框架。
与此同时,AI安全标准工作组成立,将重点推动《网络安全技术 人工智能安全能力成熟度评估方法》等核心标准的落地实施。亚信安全公司相关负责人指出,AI自主攻击智能体、基于深度伪造的商务诈骗将成为2026年最紧迫的安全挑战。
在美国方面,特朗普政府也在3月下旬推出了联邦统一AI监管框架,标志着美国AI监管从各州拼凑走向全国统一。
04 行业轶事与前瞻
英伟达加速生态布局:30天投资60亿美元
过去一个月内,英伟达向三家光互联领域公司各投资20亿美元,累计投资60亿美元,加速布局AI算力基础设施。4月9日,英伟达又参股RISC-V处理器IP厂商SiFive,参与其4亿美元G轮融资,意图在代理式AI时代制衡Arm。
碳核算大模型发布
4月8日,全球首个全景式碳核算大模型“磐石·禹衡碳核算大模型”1.0版在上海发布,覆盖生产端、消费端及自然源的全景式碳排放核算系统,旨在破解传统碳核算知识壁垒高、数据处理难、周期长等瓶颈问题。
全球首个AI伦理标准即将推出
IEEE标准协会宣布将发布全球首个AI伦理与治理标准,为行业提供可落地的安全与道德准则框架,标志着AI行业正从“技术狂奔”进入“安全合规”新阶段。
05 写在最后
过去七天,AI圈的几个关键词值得记住:
登顶——阿里“欢乐马”突袭登顶视频生成赛道榜首,展示了中国AI企业在视觉生成领域的强劲实力。
声音——字节推出全双工语音大模型,让AI从“你一句我一句”走向“边听边讲”,人机对话正在逼近自然交流。
警戒——Anthropic下一代模型惊动白宫,AI的安全边界正在被重新定义。当模型具备“黑掉系统”的能力,监管的紧迫性前所未有地凸显出来。
告别——OpenAI遭遇高管离职、CEO豪宅遭袭,行业的激烈争议与安全焦虑正在以意想不到的方式浮出水面。
合规——五部门联合发文规范AI拟人化互动服务,AI从“野蛮生长”走向“有规可循”成为必然。
AI的故事远未结束。下一个七天,GPT-6是否会如期而至?DeepSeek V4将带来怎样的惊喜?Meta的“超级智能”梦想到底能走多远?我们下周见。
夜雨聆风