2026年6月28日 AI 日报:DeepSeek DSpark 开源提速、豆包2.1 Pro登顶与OpenAI首款ASIC落地

📅 2026-06-28｜涵盖 6月25日～28日全球AI前沿动态

🔬 AI 技术与模型（Model & Research）

① DeepSeek × 北大联合开源 DSpark 推理加速框架

DeepSeek 与北京大学联合发布开源推理框架 DSpark（DeepSeek-Spark），针对 MoE 架构大模型推理做投机解码与 KV-Cache 压缩优化，实测推理吞吐量提升 60%～85%，同等负载下 GPU 显存占用下降约 30%。配合 DeepSeek-V4 Pro 宣布将 API 价格降至原价 1/4（¥0.025/万 Token），国产大模型性价比再创新低。

② 字节豆包 2.1 Pro 正式亮相，编程与 Agent 评测超越 Claude Opus 4.6

火山引擎 FORCE 大会发布 Doubao 2.1 Pro，支持 128K 上下文、原生 Function Calling 与多步规划，在 HumanEval、SWE-bench Verified 及内部 Agent 任务基准上优于 Claude Opus 4.6；同步上线豆包"专业版"订阅（¥68/月）含后台自动执行办公任务模式。

③ OpenAI 向受控伙伴有限预览 GPT-5.6 系列（Sol / Terra / Luna）

GPT-5.6 据称上下文窗口扩至 150万 Token，编程与多跳推理显著增强，Terra 版性能对标 GPT-5.5 但价格减半。受美商务部要求，本次仅向经审核的少数合作伙伴提供有限预览，暂不广泛开放。

④ 美国商务部部分解除 Anthropic Claude Mythos 5 出口限制

美商务部致函 Anthropic，允许逾 100 家获批企业或联邦机构（含外籍雇员）访问 Claude Mythos 5，但旗舰模型 Fable 5 禁令暂未解除。此举被解读为美政府对前沿模型监管从"全面封锁"转向"白名单许可"模式。

⑤ 星海图开源具身智能 VLA 模型 G0.5 + 双足人形机器人 Kengo

具身智能公司星海图发布并开源统一自回归 VLA 基础模型 Galaxea G0.5，融合视觉-语言-动作生成，在六大具身基准居首；同步首秀全尺寸双足人形机器人 Kengo，推进具身智能"模型+本体"闭环。

⑥ 华为开源盘古 openPangu 2.0（6月30日起开放核心组件）

余承东官宣开源盘古 openPangu 2.0，支持 512K 超长上下文，深度适配昇腾算力（单卡吞吐达主流开源模型 2 倍），鸿蒙生态原生 Agent 调度。7大核心组件定于 6月30日起陆续开放。

📱 产品与应用（Product & Application）

• 新华社发布"新华语典"AI智能体：基于权威时政语料库构建，支持智能问答、知识库检索、订阅推送与智能体广场，标志官媒全面拥抱 Agent 范式。

• 科大讯飞发布企业服务 Claw 平台：多智能体协同（需求理解/方案生成/报价/推荐 Agent），一句话描述业务需求即可输出可落地方案，内置 AstronClaw 零门槛部署版与 130+ Skills。

• 腾讯云 WorkBuddy 企业版 + Agent Suite：7×24 数字员工、团队模式知识沉淀、原生接入腾讯文档/网盘/乐享，主打企业 AI-Native 组织转型。

• 兆企供应链开源 WorkMate 企业 Agent 框架：含 Harness 核心框架、10 个供应链 Skills 模板及 MCP SDK，聚焦报价/合同/风控/数据分析场景的可审计 Agent 底座。

• G7 易流发布穿戴式 AI 硬件"拍拍豆"（30g）：下车自动录制、上车自动上传、AI 语音标签分类，专为货运物流交接留证设计。

• 中国移动灵犀人形机器人 MWC 26 点球夺冠：全自主攻防、自主导航、追球射门，展示具身智能在限定场景的实用化进展。

💻 硬件与算力（Hardware & Infrastructure）

• OpenAI × 博通发布首款自研推理 ASIC「Jalapeño」：专为 LLM 推理设计，OpenAI 负责架构、博通做硅实现，早期样片在实验室达标运行，每瓦性能优于当前主流 GPU，计划 2026 年起部署千兆瓦级数据中心。

• Google 正式对外出售自研 TPU + 50亿美元黑石算力中心协议：第三方首次可直接采购 Google TPU 芯片及配套硬件，并与黑石合建 500MW 算力中心，主打低价 Token 生成成本优势。

• Amazon AWS 洽谈对外出售 Trainium 芯片：定制成 ASIC 推理芯片从内部自用走向商业化，瞄准希望自建算力的大型企业客户。

• Tensordyne Napier AI 芯片（台积电 3nm）流片成功：1380亿晶体管、144GB HBM3E、峰值 2.1 PFLOPs，宣称 TDN72 机架 Token 吞吐较 Blackwell 高 17 倍，单机架可替代 9 套 NVIDIA Rubin 机架。

• 中国"灵晟"超算 ISC 2026 登顶全球第一：持续性能 2.19 EFlops，首次突破 2E Flops，搭载国产 HBM 高带宽存储，全链路自主可控。

• 高通发布数据中心 Dragonfly 产品组合：打入云端 AI 推理市场，已获 Meta、微软等客户意向，与英伟达/博通/AMD 在推理 ASIC 领域正面竞争。

💰 财经与投融资（Finance & M&A）

• DeepSeek 完成首轮外部融资超 500 亿元：估值突破 3300 亿元，资金将投向 V4 后续研发与国产算力生态建设，系国内大模型迄今最大单轮融资之一。

• Cursor（Anysphere）被 SpaceX/xAI 收购：马斯克以约 600 亿美元估值签署合并协议，Cursor 作独立品牌运营并全面接入 xAI Colossus 超算，预计 Q3 完成。

• 深度机智完成数亿元新一轮融资：国寿长三角科创基金领投，专注物理 AI 全栈（人类数据采集→模型→真机），两月内连续两轮。

• OpenAI / Anthropic / SpaceX 均秘密递交 S-1 IPO 申请：Anthropic H 轮后估值 9650 亿美元，OpenAI 估值约 8520 亿美元，SpaceX 已完成史上最大规模 IPO 筹资 750 亿美元。

• 科创板第五套标准扩围至 AI 大模型企业：证监会明确未盈利 AI 大模型公司可适用，智谱华章、MiniMax、燧原科技等科创板 IPO 进程提速。

• 国家市监总局发布《人工智能智能体互联》7 项国家标准：统一智能体身份码、发现、交互与工具调用协议，小米、联想等百余家企业参与试点——标准化本身也在催化 Agent 生态投资预期。

🔮 编辑观点与趋势判断

1. 推理降本成新主战场：DeepSeek DSpark 开源 + V4 Pro 降价、Google TPU 对外销售、OpenAI Jalapeño ASIC 流片，说明行业重心已从"参数军备竞赛"全面转向"每 Token 成本与延迟优化"，推理效率将成下一阶段核心竞争力。

2. 模型层"去神秘化"，应用层"Agent 工业化"：国标发布+多企业开源 Agent 框架（WorkMate/Claw/WorkBuddy），意味着智能体开始有统一通信协议与审计规范，2026 下半年将看到跨平台 Multi-Agent 系统在企业侧规模落地。

3. 算力格局三分天下：NVIDIA GPU（训练+高端推理）仍占主导，但 Cloud TPU/Trainium/Jalapeño ASIC 在推理侧快速侵蚀份额，叠加国产昇腾+灵晟超算突破，全球 AI 算力供应链多元化不可逆。

4. 资本向"全栈+具身"聚集：DeepSeek 巨额融资、Cursor 被收编、具身智能（星海图/深度机智）获青睐，投资逻辑正从"买模型公司"转向"买能控制数据-模型-本体全链路或能深度绑定超级算力生态的玩家"。