AI内参|DeepSeek V4 开源预览、NVIDIA Vera Rubin 全面投产、Q1全球风投暴增至$297B创历史纪录

2026年5月9日 · 周六深度刊

AI内参｜DeepSeek V4 开源预览、NVIDIA Vera Rubin 全面投产、Q1全球风投暴增至$297B创历史纪录

◆ 技术生态

1. DeepSeek V4 正式开源预览：1.6T 参数 MoE 架构，国产芯片训练

4月24日，DeepSeek 正式发布 V4 系列模型的公开预览版本，包括 DeepSeek-V4-Pro（862B 总参数量/49B 激活参数）和 DeepSeek-V4-Flash（158B 总参数量），全部以 MIT 许可证开源发布于 Hugging Face。DeepSeek V4 代表了这家中国 AI 实验室在架构创新上的重大飞跃。

核心技术参数：

总参数量约 1.6T（DeepSeek-V4-Pro-Base），采用 Mixture-of-Experts 架构，每 token 仅激活约 49B 参数
上下文窗口达 1M tokens，搭载创新的 Engram 条件记忆架构（CSA+HCA 混合注意力机制）
支持原生多模态生成（文本 + 图像 + 视频）
训练算力部署在华为 Ascend 950 集群和 Cambricon 芯片上——华为在发布日公开确认 Ascend 950 集群支撑了 V4 的训练

架构三大创新：

CSA（压缩稀疏注意力）
：通过压缩机 + 闪电索引器 + 滑动窗口分支，大幅降低长上下文推理的计算开销
HCA（重度压缩注意力）
：实现 128 倍压缩的密集 MQA，使 1M 上下文窗口的 KV 缓存成本接近线性增长
Multi-scale MoE + Manifold-constrained Hyper-connections
：多尺度专家混合与流形约束超连接

战略意义：
V4 是首个在国产 AI 芯片上完成训练并达到前沿水平的千亿级参数开源模型，标志着中国 AI 硬件生态（华为 Ascend/Cambricon）正式具备了支撑大模型训练的可行路径。

来源：
https://api-docs.deepseek.com/news/news260424
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro
https://huggingface.co/blog/deepseekv4
https://www.cnbc.com/2026/04/24/deepseek-v4-llm-preview-open-source-ai-competition-china.html

2. Claude Opus 4.7 正式发布：SWE-bench 87.6%，同价但暗藏 Tokenizer 升级

4月16日，Anthropic 发布 Claude Opus 4.7，保持 $5/$25 每百万 tokens 的定价不变，但在多个关键基准上取得了显著提升。该模型同时是 Anthropic 目前公开可用的最强模型（Claude Mythos Preview 仍仅限于企业合作伙伴内测）。

基准测试	Opus 4.7	Opus 4.6	提升
SWE-bench Verified	87.6%	80.8%	+6.8pp
GPQA Diamond	94.2%	-	-
MCP-Atlas 工具使用	77.3%	75.8%	+1.5pp
Finance Agent v1.1	64.4%	-	新 SOTA
OSWorld-Verified 计算机使用	78.0%	-	-

新特性：xhigh 努力级别、3.3 倍更高分辨率视觉、自验证机制。但新 Tokenizer 在相同输入下会增加约 35% 的 token 消耗，实际使用成本可能上升。

值得注意的局限：
Claude Mythos Preview（4月7日发布）是 Anthropic 真正最强大的模型，SWE-bench Verified 达 93.9%，Terminal-Bench 82.0%，但仅对企业平台合作伙伴开放。

来源：
https://www.anthropic.com/news/claude-opus-4-7
https://llm-stats.com/blog/research/claude-opus-4-7-launch
https://www.vellum.ai/blog/claude-opus-4-7-benchmarks-explained

3. GPT-5.5-Cyber：OpenAI 首次实施"可信访问"安全分发模式

4月23日，OpenAI 发布 GPT-5.5 基座模型，随后在 5月1日推出 GPT-5.5-Cyber 网络安全专用版本，并启动 Trusted Access for Cyber (TAC) 可信访问计划。这是 OpenAI 首次对特定领域的高风险模型实施严格的分发控制。

英国 AI 安全研究所（UK AISI）评价该模型是"其测试过的网络任务中最强的模型之一"。仅10天前的 4月21日，Sam Altman 还在公开批评 Anthropic 是"恐惧营销"，称其"试图将 AI 控制在少数人手中"。然而不到两周后，OpenAI 采用了几乎相同的限制性分发模式——这一反转揭示了行业深层趋势。

来源：
https://openai.com/index/gpt-5-5-with-trusted-access-for-cyber/
https://techcrunch.com/2026/04/21/sam-altman-throws-shade-at-anthropics-cyber-model-mythos-fear-based-marketing/
https://www.theregister.com/2026/05/01/openai_locks_gpt55cyber_behind_velvet/

4. NVIDIA Vera Rubin 全面投产：Agentic AI 推理时代的算力基座

在 GTC 2026 大会上，NVIDIA 正式发布 Vera Rubin 平台并宣布全面投产。Vera Rubin NVL72 单机架集成 72 颗 Rubin GPU + 36 颗 Vera CPU，液冷散热，提供 3.6 EFLOPS NVFP4 推理算力，与 Blackwell 相比推理每百万 tokens 成本降低 90%。平台集成 Groq 3 LPU（来自 NVIDIA $200亿收购 Groq 的成果），专为低延迟大上下文 Agent 推理设计。

七芯片协同架构：
Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 交换机、Groq 3 LPU，覆盖计算、网络、存储和安全。

来源：
https://nvidianews.nvidia.com/news/nvidia-vera-rubin-platform
https://www.nvidia.com/en-us/data-center/vera-rubin-nvl72/
https://hashrateindex.com/blog/nvidia-vera-rubin-nvl72-specs-breakdown/

5. Grok 4.3、Hugging Face 200万模型里程碑 & 开源 Agent 框架爆发

Grok 4.3：xAI 以 $1.25/$2.50 每百万 tokens 的激进定价发布 Grok 4.3，上下文窗口 1M，配备语音克隆套件。相比前代 Grok 4.2，价格降幅达 40-58%，为即将到来的 IPO 抢占 API 市场份额。

Hugging Face 平台突破 200万模型里程碑。Spring 2026 开源生态报告显示中国开源模型使用量持续增长，国产芯片支持加速，Kernel Hub 已上线。

来源：
https://venturebeat.com/technology/xai-launches-grok-4-3-at-an-aggressively-low-price/
https://huggingface.co/blog/huggingface/state-of-os-hf-spring-2026
https://aiworld.eu/story/hugging-faces-two-million-models-and-counting

◆ 大厂动态

1. Q1 全球风投创纪录：$2970亿，81% 涌入 AI

根据 Crunchbase 数据，2026年第一季度全球创业投资达到 $2970亿，打破历史所有季度纪录，甚至超过 2025年全年风投总额的约 70%。

AI 公司获得约 $2390-2420亿（占全球风投的 80-81%），仅 OpenAI（$1220亿，估值 $8520亿）、Anthropic（$300亿，估值 $3800亿）、xAI（$200亿）、Waymo（$160亿）四家公司就吞下了全球风投的约 64%。第一季度 OpenAI 的单笔融资额就超过了此前任何一个完整季度的全球风投总额。

这种空前的资本集中引发了泡沫风险讨论。AI 种子轮估值急剧上升，前 OpenAI CTO Mira Murati 创立的 Thinking Machine Labs 以 $120亿估值完成史上最大种子轮。

来源：
https://techcrunch.com/2026/04/01/startup-funding-shatters-all-records-in-q1/
https://techcrunch.com/2026/03/31/its-not-your-imagination-ai-seed-startups-are-commanding-higher-valuations/
https://techcrunch.com/2026/02/12/anthropic-raises-another-30-billion-in-series-g-with-a-new-value-of-380-billion/

2. Cerebras 提交 IPO 申请：目标估值 $266亿

4月18日，AI 芯片初创公司 Cerebras Systems 正式提交 IPO 申请，目标估值约 $266亿，计划募资 $35亿。与 OpenAI 签订价值超过 $100亿 的合同（据 WSJ）。CEO Andrew Feldman 表示："英伟达不想失去 OpenAI 的快速推理业务，而我们从他们手中夺走了这个机会。"

来源：
https://techcrunch.com/2026/04/18/ai-chip-startup-cerebras-files-for-ipo/
https://techbuzz.ai/articles/cerebras-eyes-ipo-at-3x-valuation-as-ai-chip-wars-heat-up

3. OpenAI vs Anthropic：从口水战到殊途同归

4月21日 Sam Altman 批评 Anthropic"恐惧营销"，5月1日 OpenAI 推出几乎完全相同的 GPT-5.5-Cyber 和 TAC 可信访问计划。这一反转揭示了行业趋势：随着模型能力逼近 AGI 门槛，各实验室对双重用途能力的管控从口头承诺转向实际制度约束。

来源：
https://techcrunch.com/2026/04/21/sam-altman-throws-shade-at-anthropics-cyber-model-mythos-fear-based-marketing/
https://aicentral.substack.com/p/the-ai-landscape-may-2026

◆ 论文解读

论文一：AI Co-Mathematician —— 数学家的 AI 协同工作台

arXiv:2605.06651 · https://arxiv.org/abs/2605.06651

HF Papers：https://huggingface.co/papers/2605.06651

基于 Gemini 语言模型构建的交互式数学研究协作系统。项目协调 Agent 将复杂任务委派给多个并行工作流，支持人机协同的开放式数学研究。在 FrontierMath Tier 4 得分 48%，创所有 AI 系统新高。

论文二：SkillOS —— 用强化学习训练智能体自主策管技能

arXiv:2605.06614 · https://arxiv.org/abs/2605.06614

HF Papers：https://huggingface.co/papers/2605.06614

提出经验驱动的 RL 训练方案，包含冻结的执行器和可训练的技能策管器。在多轮 Agent 任务上一致优于无记忆和强记忆基线，且跨执行器骨干和领域泛化。

论文三：Agentic World Modeling —— 从预测器到自主演化器

arXiv:2604.22748 · https://arxiv.org/abs/2604.22748

HF Papers：https://huggingface.co/papers/2604.22748

提出层级框架：L1 预测器（单步转移）→ L2 模拟器（多步 rollout）→ L3 演化器（自主修正模型）。四大定律体系：物理、数字、社会、科学。同期 "Visual Generation in the New Era"（arXiv:2604.28185）提出五级视觉生成分类法，形成互补理论框架。

标签： #AI日报 #DeepSeekV4 #ClaudeOpus4_7 #GPT5_5 #NVIDIAVeraRubin #AgenticAI #SkillOS #Q1Funding #CerebrasIPO #WorldModeling