清华五道口AI俱乐部 |AI产业快讯:视频模型技术优化,语音助手体验升级,编程工具版本迭代,具身智能样机展示

大家早上好! 这里是清华五道口AI俱乐部,每天为你报道最新AI行业相关要闻。

阿里ATH宣布AI视频模型HappyHorse-1.0开放测试
2026年4月20日,阿里ATH创新事业部宣布,旗下AI视频生成模型HappyHorse-1.0将于4月27日通过阿里云百炼平台逐步开放API测试,首批邀测对象为企业级客户,预计5月份正式发布商用。该模型支持文本转视频、图像转视频及音频生成,并已登顶Artificial Analysis的AI Video Arena排行榜,在文生视频(无音频)赛道ElO评分1379分,领先第二名超100分,在图像生视频(无音频)赛道以1411分刷新平台历史纪录。HappyHorse采用约150亿参数的单流自注意力Transformer架构,将文本、视频与音频Token放入同一序列进行联合建模,一次性生成带音轨的完整视频。该项目由ATH创新事业部主导,联合阿里平台技术、通义实验室及淘天技术等多个团队协同打造,阿里巴巴CEO吴泳铭亲自负责ATH事业群,全面推进阿里AI战略落地。

谷歌与Marvell启动AI推理芯片联合研发
日前,谷歌与半导体巨头Marvell正式宣布启动一项面向下一代AI推理芯片的联合研发项目。该项目设定明确技术指标:能效比目标突破每瓦特5.0 TFLOPS大关,单芯片功耗严格控制在150瓦以内。研发重点聚焦存算一体架构革新、专用算子硬件加速单元以及动态电压频率调节技术,力求在数据中心推理场景中显著优化单位算力成本与能效表现。合作模式上,谷歌将依据内部模型需求定义算法架构与规格,Marvell则主导基于7纳米和5纳米先进制程的物理实现与工程验证。根据规划,首款工程样片预计于2027年第一季度交付,届时将优先用于Gemini大模型的推理服务,此举被业界视为直接挑战英伟达在AI推理加速市场长期主导地位的关键布局。

阿里发布Qwen3.6-Max-Preview,智能体编程能力显著提升
2026年4月20日,阿里巴巴正式发布Qwen3.6-Max-Preview,作为Qwen系列新一代旗舰模型的早期预览版。用户可在Qwen Studio交互体验,并即将通过阿里云百炼API调用。相比Qwen3.6-Plus,预览版在智能体编程方面大幅提升:SkillsBench +9.9、SciCode +10.8、NL2Repo +5.0、Terminal-Bench 2.0 +3.8;同时在六项主要编程基准(SWE-bench Pro等)取得最高分。世界知识(SuperGPQA +2.3、QwenChineseBench +5.3)和指令遵循(ToolcallFormatIFBench +2.8)也均有优化。官方表示,该预览版仍在积极迭代中。

UU跑腿发布全球首个AI跑腿Skill插件
2026年4月20日,UU跑腿发布全球首个跑腿Skill插件,为Qoder、Cursor、Claude、OpenClaw等AI智能体应用提供配送服务支持。该插件功能涵盖订单询价、发单、订单管理和跑男实时追踪,用户可通过手机号一键注册实现一句话发单。商户可批量智能调度复杂任务,由AI规划最优分发路径,并支持与商家订单后台打通实现履约自动化。首批合作覆盖北京、上海等15个城市。

苏度科技发布具身机器人系统Sudo R1
2026年4月20日,苏度科技发布首个软硬件全栈自研的具身机器人系统Sudo R1。该系统采用世界模型与强化学习一体化设计,在纯仿真训练模式下实现零样本抓取任务98%首次成功率。测试覆盖透明、柔性物体及动态背景等复杂场景,验证了其泛化性与鲁棒性。技术核心在于高保真仿真器提供的物理动力学数据支持,以及底层模型对世界模型与强化学习的系统性整合。

阿里通义实验室推出语音识别大模型Fun-ASR1.5
2026年4月20日,阿里通义实验室推出语音识别大模型Fun-ASR1.5。该模型基于统一大模型架构,单模型覆盖30种语言、汉语七大方言及20+地方口音,采用MoE架构实现语言动态激活。中文方言平均字错误率较上一版本下降56.2%,可精准识别上海话“侬”等特色词汇。针对古诗词识别优化,字符级准确率达97%。该模型已在阿里云百炼平台上线API服务。

22岁开发者开源Claude Mythos架构逆推项目OpenMythos
近日,22岁开发者Kye Gomez开源OpenMythos项目,基于公开研究和对Claude Mythos架构的推测实现循环深度Transformer(RDT)。RDT采用770M参数通过16轮循环计算替代传统深度堆叠,结合MoE路由机制激活不同专家子集。实验显示其性能与1.3B参数标准Transformer相当,在知识组合和推理链扩展任务中表现更优。该项目遵循MIT协议,代码已托管至GitHub,获Hugging Face社区快速集成。

蚂蚁灵光App推出“灵光圈”创意社区功能
2026年4月20日,蚂蚁灵光App正式上线“灵光圈”功能,打造可分享、点赞及二次创作的公共创意空间。用户生成闪应用并发布至灵光圈即可参与亿元激励计划,每日最高100万激励10000个优质应用,每周最高100万激励100名创作者。该功能强化闪应用的多智能体协作与全模态生成能力,支持手机端原生能力集成,旨在构建消费级Coding Agent生态。

OpenAI收购教育科技公司Chalkie
近日,OpenAI宣布完成对教育科技公司Chalkie的收购,交易金额未披露。Chalkie专注于K-12自适应学习技术,此次收购旨在整合其教育场景数据与OpenAI通用大模型能力,加速教育垂直领域产品开发。OpenAI教育产品负责人表示,将保留Chalkie原有团队,并计划在2026年秋季推出首个多模态教育智能体。交易已通过美国FTC反垄断审查。

IDC预测2030年全球人形机器人出货量将达51万台
2026年4月20日,IDC发布预测报告称,2030年全球人形机器人出货量将突破51万台,年复合增长率近95%。2025年全球出货量超1.8万台,中国厂商占比达95%,主导硬件制造与规模化。文娱表演、教育科研及导览导购场景应用占比超85%,工业制造与仓储物流已开展试点。报告指出,多家中国头部厂商计划2026年实现万台级产能,成本下降是规模化关键驱动力。
以上就是今日AI快讯的全部内容,感谢大家的收听。


夜雨聆风