乐于分享
好东西不私藏

AI日报 | GPT-5.5与DeepSeek V4同天开卷,国产开源首超Claude

AI日报 | GPT-5.5与DeepSeek V4同天开卷,国产开源首超Claude

GPT-5.5和DeepSeek V4同天发布,国产开源首超Claude Opus 4.6,AI竞争进入新阶段。

🤖 旗舰模型正面交锋

 

   🔥 GPT-5.5来了:100万token上下文,涨价一倍
 

 

📌 OpenAI

 

   4月23日,OpenAI正式发布GPT-5.5,这是自GPT-4.5以来首次从零开始重训的基座模型。最大亮点是API支持100万token上下文,Terminal-Bench 2.0拿到82.7%,Coding能力比上一代提升明显。更难得的是,GPT-5.5在大幅提升智能的同时,保持了和GPT-5.4几乎一样的响应速度,完成相同任务消耗的token还更少。当然价格也涨了:$5/百万输入,$30/百万输出。

同一天,DeepSeek V4也开源发布,直接和GPT-5.5正面竞争。1.6万亿参数的Pro版+2840亿参数的Flash版,同样有100万token上下文,MIT协议完全开源。技术上有新东西——混合注意力架构,100万token场景下推理成本只有V3.2版本的27%。中文能力是开源里最强的,华为昇腾950集群已全面支持。中芯国际和华虹半导体港股当天大涨8-15%。

OpenAI和DeepSeek选在同一天发布旗舰模型,火药味很浓。这也标志着行业重心变了:光有benchmark分数不够,能不能稳定完成8小时真实工作才是新标准。
 

 

   🔥 国产开源首超Claude Opus 4.6:智谱GLM-5.1登场
 

 

📌 智谱AI

 

   4月8日,智谱发布GLM-5.1,成为全球首个在编程核心榜单SWE-Bench Pro上超越Claude Opus 4.6的开源模型。7440亿参数(MoE架构,40亿活跃参数),200K上下文,MIT协议全开源。

智谱官方给它的定位是「唯一能持续工作8小时的开源模型」——单次任务中从规划、执行到迭代优化跑完整圈,交付工程级成果。在Coding和长程任务上实际表现已经和Opus 4.6不相上下,14小时后CUDA专家社区炸锅了。免费+开源+性能追平顶尖闭源方案,GLM-5.1把开源模型天花板抬到了新高度。
 

 

   🤯 Claude Mythos 5:10万亿参数,但有钱也买不到
 

 

📌 Anthropic

 

   Anthropic在4月7日确认了Claude Mythos的存在——这是全球首个10万亿参数模型,也是Anthropic有史以来最强大的模型。

然而,Anthropic选择不公开发售。Mythos触发了ASL-4安全协议(模型接近「危险能力阈值」时的分类),只通过一个叫Project Glasswing的计划,向50家关键基础设施合作伙伴提供受限访问,包括AWS、苹果、微软、谷歌、NVIDIA、CrowdStrike、摩根大通等。用途很明确:让他们用Mythos扫描自家系统和开源代码库,寻找可被利用的漏洞——赶在攻击者之前。预览价格$25/$125每百万token,没有公开API,也没有上市时间表。

这代表了一种新的AI分发哲学:最强模型不等于最开放模型,安全性开始实质性地限制技术流通。
 

🚀 开源与芯片

 

   💡 Google Gemma 4:Apache 2.0,最强开放权重家族
 

 

📌 Google DeepMind

 

   4月3日Google发布Gemma 4全系列,包括27B、26B-A4B、E2B、E4B等多个尺寸,全部采用Apache 2.0协议——这是主流厂商首次在最强模型上采用无附加条件的开源许可。

Gemma 4支持超过140种语言,具备多步规划、复杂逻辑推理和智能体构建能力。累计下载量已超4亿次,衍生模型变体超过10万个。Apache 2.0意味着企业可以完全自由地商用、修改、分发,没有任何使用限制或强制政策。这对RAG系统、本地Agent工作流等企业场景吸引力很大——不需要API费用,不需要数据出境。
 

 

   ⚡ Qwen3.6-Plus:阿里发布,国产编程能力最强
 

 

📌 阿里巴巴

 

   4月2日阿里发布Qwen3.6-Plus,在智能体编程SWE-bench系列评测中,编程表现超越2倍乃至3倍参数量的GLM-5和Kimi-K2.5,成为国产编程能力最强的模型。4月15日进一步开源了Qwen3.6-35B-A3B,延续开源策略。不到一个半月就从Qwen3.5迭代到3.6,节奏明显加快。

同天字节跳动发布豆包语音大模型Seeduplex,基于「边听边说」的全双工框架,自然感大幅提升,已在豆包App全量上线。
 

 

   🔧 特斯拉AI5芯片流片完成:2027年量产,性能提升40倍
 

 

📌 Tesla / 马斯克

 

   马斯克4月15日宣布特斯拉AI5芯片完成流片,设计已移交代工厂,2027年由三星和台积电在美国本土工厂分别代工。AI5单芯性能对标英伟达Hopper架构,双芯接近Blackwell级别,整体性能较AI4提升40倍。

用途很明确:自动驾驶和人形机器人的核心算力平台。马斯克宣称AI5将成为有史以来产量最高的AI芯片之一。同期博通与Meta达成数十亿美元协议,共同开发定制AI芯片,Meta 2026年资本支出预算1150-1350亿美元用于AI能力建设。
 

💰 资本与行业

 

   💸 具身智能单轮4.55亿美元:它石智航刷新纪录
 

 

📌 它石智航

 

   4月16日,它石智航宣布完成超4.55亿美元Pre-A轮融资,由高瓴创投与红杉中国联合领投,美团战投作为基石战略股东加注。这是中国具身智能领域有史以来最高单轮融资——也是该公司第二次刷新行业纪录:2025年Q2他们已完成中国具身智能最大天使轮2.42亿美元。

具身智能赛道整体热度空前。2026年Q1国内具身智能披露融资超50起,累计融资额约200亿元,同比增长近60%。京东同日宣布全球首推覆盖「采、存、标、训、评、仿、测」全链路的具身智能数据基础设施。赛道从技术验证期快速进入规模化融资期。
 

 

   📊 Token消耗量井喷,算力政策加码
 

 

📌 国家发改委 / 工信部

 

   2026年3月,中国日均Token调用量突破140万亿,较2025年末增长超40%。OpenRouter周度Token消耗量较一年前增加7-8倍,其中国产大模型占了约40%。

算力涨价链条已全面传导:HBM高端芯片严重缺货,Q1存储价格翻倍。需求从训练转向推理,硬件采购和运维成本居高不下。政策面迅速响应:4月17日国家发改委表示今年重点在「人工智能+」基础设施等领域扩大投资;工信部印发通知,组织普惠算力赋能中小企业专项行动,「算力银行」「算力超市」要来了。国家队入场,给中小企业用算成本减压。
 

 

   💡 小编点评
 

 

   这周太热闹了,OpenAI和DeepSeek选在同一天发布旗舰模型,火药味十足。国产开源模型终于在编程能力上追上顶级闭源方案,这个节点值得关注。
 
 📊 本文由 AI 自动采集 & 生成 | 关注我们,每日获取最新财经资讯