2026年5月9日 · 周六深度刊
AI内参|DeepSeek V4 开源预览、NVIDIA Vera Rubin 全面投产、Q1全球风投暴增至$297B创历史纪录
◆ 技术生态
1. DeepSeek V4 正式开源预览:1.6T 参数 MoE 架构,国产芯片训练
4月24日,DeepSeek 正式发布 V4 系列模型的公开预览版本,包括 DeepSeek-V4-Pro(862B 总参数量/49B 激活参数)和 DeepSeek-V4-Flash(158B 总参数量),全部以 MIT 许可证开源发布于 Hugging Face。DeepSeek V4 代表了这家中国 AI 实验室在架构创新上的重大飞跃。
核心技术参数:
总参数量约 1.6T(DeepSeek-V4-Pro-Base),采用 Mixture-of-Experts 架构,每 token 仅激活约 49B 参数 上下文窗口达 1M tokens,搭载创新的 Engram 条件记忆架构(CSA+HCA 混合注意力机制) 支持原生多模态生成(文本 + 图像 + 视频) 训练算力部署在华为 Ascend 950 集群和 Cambricon 芯片上——华为在发布日公开确认 Ascend 950 集群支撑了 V4 的训练
架构三大创新:
- CSA(压缩稀疏注意力)
:通过压缩机 + 闪电索引器 + 滑动窗口分支,大幅降低长上下文推理的计算开销 - HCA(重度压缩注意力)
:实现 128 倍压缩的密集 MQA,使 1M 上下文窗口的 KV 缓存成本接近线性增长 - Multi-scale MoE + Manifold-constrained Hyper-connections
:多尺度专家混合与流形约束超连接
战略意义:V4 是首个在国产 AI 芯片上完成训练并达到前沿水平的千亿级参数开源模型,标志着中国 AI 硬件生态(华为 Ascend/Cambricon)正式具备了支撑大模型训练的可行路径。
来源:
https://api-docs.deepseek.com/news/news260424
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro
https://huggingface.co/blog/deepseekv4
https://www.cnbc.com/2026/04/24/deepseek-v4-llm-preview-open-source-ai-competition-china.html
2. Claude Opus 4.7 正式发布:SWE-bench 87.6%,同价但暗藏 Tokenizer 升级
4月16日,Anthropic 发布 Claude Opus 4.7,保持 $5/$25 每百万 tokens 的定价不变,但在多个关键基准上取得了显著提升。该模型同时是 Anthropic 目前公开可用的最强模型(Claude Mythos Preview 仍仅限于企业合作伙伴内测)。
新特性:xhigh 努力级别、3.3 倍更高分辨率视觉、自验证机制。但新 Tokenizer 在相同输入下会增加约 35% 的 token 消耗,实际使用成本可能上升。
值得注意的局限:Claude Mythos Preview(4月7日发布)是 Anthropic 真正最强大的模型,SWE-bench Verified 达 93.9%,Terminal-Bench 82.0%,但仅对企业平台合作伙伴开放。
来源:
https://www.anthropic.com/news/claude-opus-4-7
https://llm-stats.com/blog/research/claude-opus-4-7-launch
https://www.vellum.ai/blog/claude-opus-4-7-benchmarks-explained
3. GPT-5.5-Cyber:OpenAI 首次实施"可信访问"安全分发模式
4月23日,OpenAI 发布 GPT-5.5 基座模型,随后在 5月1日推出 GPT-5.5-Cyber 网络安全专用版本,并启动 Trusted Access for Cyber (TAC) 可信访问计划。这是 OpenAI 首次对特定领域的高风险模型实施严格的分发控制。
英国 AI 安全研究所(UK AISI)评价该模型是"其测试过的网络任务中最强的模型之一"。仅10天前的 4月21日,Sam Altman 还在公开批评 Anthropic 是"恐惧营销",称其"试图将 AI 控制在少数人手中"。然而不到两周后,OpenAI 采用了几乎相同的限制性分发模式——这一反转揭示了行业深层趋势。
来源:
https://openai.com/index/gpt-5-5-with-trusted-access-for-cyber/
https://techcrunch.com/2026/04/21/sam-altman-throws-shade-at-anthropics-cyber-model-mythos-fear-based-marketing/
https://www.theregister.com/2026/05/01/openai_locks_gpt55cyber_behind_velvet/
4. NVIDIA Vera Rubin 全面投产:Agentic AI 推理时代的算力基座
在 GTC 2026 大会上,NVIDIA 正式发布 Vera Rubin 平台并宣布全面投产。Vera Rubin NVL72 单机架集成 72 颗 Rubin GPU + 36 颗 Vera CPU,液冷散热,提供 3.6 EFLOPS NVFP4 推理算力,与 Blackwell 相比推理每百万 tokens 成本降低 90%。平台集成 Groq 3 LPU(来自 NVIDIA $200亿收购 Groq 的成果),专为低延迟大上下文 Agent 推理设计。
七芯片协同架构:Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 交换机、Groq 3 LPU,覆盖计算、网络、存储和安全。
来源:
https://nvidianews.nvidia.com/news/nvidia-vera-rubin-platform
https://www.nvidia.com/en-us/data-center/vera-rubin-nvl72/
https://hashrateindex.com/blog/nvidia-vera-rubin-nvl72-specs-breakdown/
5. Grok 4.3、Hugging Face 200万模型里程碑 & 开源 Agent 框架爆发
Grok 4.3:xAI 以 $1.25/$2.50 每百万 tokens 的激进定价发布 Grok 4.3,上下文窗口 1M,配备语音克隆套件。相比前代 Grok 4.2,价格降幅达 40-58%,为即将到来的 IPO 抢占 API 市场份额。
Hugging Face 平台突破 200万 模型里程碑。Spring 2026 开源生态报告显示中国开源模型使用量持续增长,国产芯片支持加速,Kernel Hub 已上线。
来源:
https://venturebeat.com/technology/xai-launches-grok-4-3-at-an-aggressively-low-price/
https://huggingface.co/blog/huggingface/state-of-os-hf-spring-2026
https://aiworld.eu/story/hugging-faces-two-million-models-and-counting
◆ 大厂动态
1. Q1 全球风投创纪录:$2970亿,81% 涌入 AI
根据 Crunchbase 数据,2026年第一季度全球创业投资达到 $2970亿,打破历史所有季度纪录,甚至超过 2025年全年风投总额的约 70%。
AI 公司获得约 $2390-2420亿(占全球风投的 80-81%),仅 OpenAI($1220亿,估值 $8520亿)、Anthropic($300亿,估值 $3800亿)、xAI($200亿)、Waymo($160亿)四家公司就吞下了全球风投的约 64%。第一季度 OpenAI 的单笔融资额就超过了此前任何一个完整季度的全球风投总额。
这种空前的资本集中引发了泡沫风险讨论。AI 种子轮估值急剧上升,前 OpenAI CTO Mira Murati 创立的 Thinking Machine Labs 以 $120亿 估值完成史上最大种子轮。
来源:
https://techcrunch.com/2026/04/01/startup-funding-shatters-all-records-in-q1/
https://techcrunch.com/2026/03/31/its-not-your-imagination-ai-seed-startups-are-commanding-higher-valuations/
https://techcrunch.com/2026/02/12/anthropic-raises-another-30-billion-in-series-g-with-a-new-value-of-380-billion/
2. Cerebras 提交 IPO 申请:目标估值 $266亿
4月18日,AI 芯片初创公司 Cerebras Systems 正式提交 IPO 申请,目标估值约 $266亿,计划募资 $35亿。与 OpenAI 签订价值超过 $100亿 的合同(据 WSJ)。CEO Andrew Feldman 表示:"英伟达不想失去 OpenAI 的快速推理业务,而我们从他们手中夺走了这个机会。"
来源:
https://techcrunch.com/2026/04/18/ai-chip-startup-cerebras-files-for-ipo/
https://techbuzz.ai/articles/cerebras-eyes-ipo-at-3x-valuation-as-ai-chip-wars-heat-up
3. OpenAI vs Anthropic:从口水战到殊途同归
4月21日 Sam Altman 批评 Anthropic"恐惧营销",5月1日 OpenAI 推出几乎完全相同的 GPT-5.5-Cyber 和 TAC 可信访问计划。这一反转揭示了行业趋势:随着模型能力逼近 AGI 门槛,各实验室对双重用途能力的管控从口头承诺转向实际制度约束。
来源:
https://techcrunch.com/2026/04/21/sam-altman-throws-shade-at-anthropics-cyber-model-mythos-fear-based-marketing/
https://aicentral.substack.com/p/the-ai-landscape-may-2026
◆ 论文解读
论文一:AI Co-Mathematician —— 数学家的 AI 协同工作台
arXiv:2605.06651 · https://arxiv.org/abs/2605.06651
HF Papers:https://huggingface.co/papers/2605.06651
基于 Gemini 语言模型构建的交互式数学研究协作系统。项目协调 Agent 将复杂任务委派给多个并行工作流,支持人机协同的开放式数学研究。在 FrontierMath Tier 4 得分 48%,创所有 AI 系统新高。
论文二:SkillOS —— 用强化学习训练智能体自主策管技能
arXiv:2605.06614 · https://arxiv.org/abs/2605.06614
HF Papers:https://huggingface.co/papers/2605.06614
提出经验驱动的 RL 训练方案,包含冻结的执行器和可训练的技能策管器。在多轮 Agent 任务上一致优于无记忆和强记忆基线,且跨执行器骨干和领域泛化。
论文三:Agentic World Modeling —— 从预测器到自主演化器
arXiv:2604.22748 · https://arxiv.org/abs/2604.22748
HF Papers:https://huggingface.co/papers/2604.22748
提出层级框架:L1 预测器(单步转移)→ L2 模拟器(多步 rollout)→ L3 演化器(自主修正模型)。四大定律体系:物理、数字、社会、科学。同期 "Visual Generation in the New Era"(arXiv:2604.28185)提出五级视觉生成分类法,形成互补理论框架。
标签: #AI日报 #DeepSeekV4 #ClaudeOpus4_7 #GPT5_5 #NVIDIAVeraRubin #AgenticAI #SkillOS #Q1Funding #CerebrasIPO #WorldModeling
夜雨聆风