AI日报 | GPT-5.5与DeepSeek V4同天开卷,国产开源首超Claude
🤖 旗舰模型正面交锋
同一天,DeepSeek V4也开源发布,直接和GPT-5.5正面竞争。1.6万亿参数的Pro版+2840亿参数的Flash版,同样有100万token上下文,MIT协议完全开源。技术上有新东西——混合注意力架构,100万token场景下推理成本只有V3.2版本的27%。中文能力是开源里最强的,华为昇腾950集群已全面支持。中芯国际和华虹半导体港股当天大涨8-15%。
OpenAI和DeepSeek选在同一天发布旗舰模型,火药味很浓。这也标志着行业重心变了:光有benchmark分数不够,能不能稳定完成8小时真实工作才是新标准。
智谱官方给它的定位是「唯一能持续工作8小时的开源模型」——单次任务中从规划、执行到迭代优化跑完整圈,交付工程级成果。在Coding和长程任务上实际表现已经和Opus 4.6不相上下,14小时后CUDA专家社区炸锅了。免费+开源+性能追平顶尖闭源方案,GLM-5.1把开源模型天花板抬到了新高度。
然而,Anthropic选择不公开发售。Mythos触发了ASL-4安全协议(模型接近「危险能力阈值」时的分类),只通过一个叫Project Glasswing的计划,向50家关键基础设施合作伙伴提供受限访问,包括AWS、苹果、微软、谷歌、NVIDIA、CrowdStrike、摩根大通等。用途很明确:让他们用Mythos扫描自家系统和开源代码库,寻找可被利用的漏洞——赶在攻击者之前。预览价格$25/$125每百万token,没有公开API,也没有上市时间表。
这代表了一种新的AI分发哲学:最强模型不等于最开放模型,安全性开始实质性地限制技术流通。
🚀 开源与芯片
Gemma 4支持超过140种语言,具备多步规划、复杂逻辑推理和智能体构建能力。累计下载量已超4亿次,衍生模型变体超过10万个。Apache 2.0意味着企业可以完全自由地商用、修改、分发,没有任何使用限制或强制政策。这对RAG系统、本地Agent工作流等企业场景吸引力很大——不需要API费用,不需要数据出境。
同天字节跳动发布豆包语音大模型Seeduplex,基于「边听边说」的全双工框架,自然感大幅提升,已在豆包App全量上线。
用途很明确:自动驾驶和人形机器人的核心算力平台。马斯克宣称AI5将成为有史以来产量最高的AI芯片之一。同期博通与Meta达成数十亿美元协议,共同开发定制AI芯片,Meta 2026年资本支出预算1150-1350亿美元用于AI能力建设。
💰 资本与行业
具身智能赛道整体热度空前。2026年Q1国内具身智能披露融资超50起,累计融资额约200亿元,同比增长近60%。京东同日宣布全球首推覆盖「采、存、标、训、评、仿、测」全链路的具身智能数据基础设施。赛道从技术验证期快速进入规模化融资期。
算力涨价链条已全面传导:HBM高端芯片严重缺货,Q1存储价格翻倍。需求从训练转向推理,硬件采购和运维成本居高不下。政策面迅速响应:4月17日国家发改委表示今年重点在「人工智能+」基础设施等领域扩大投资;工信部印发通知,组织普惠算力赋能中小企业专项行动,「算力银行」「算力超市」要来了。国家队入场,给中小企业用算成本减压。
夜雨聆风