📅 2026-06-28|涵盖 6月25日~28日全球AI前沿动态
🔬 AI 技术与模型(Model & Research)
① DeepSeek × 北大联合开源 DSpark 推理加速框架
DeepSeek 与北京大学联合发布开源推理框架 DSpark(DeepSeek-Spark),针对 MoE 架构大模型推理做投机解码与 KV-Cache 压缩优化,实测推理吞吐量提升 60%~85%,同等负载下 GPU 显存占用下降约 30%。配合 DeepSeek-V4 Pro 宣布将 API 价格降至原价 1/4(¥0.025/万 Token),国产大模型性价比再创新低。
② 字节豆包 2.1 Pro 正式亮相,编程与 Agent 评测超越 Claude Opus 4.6
火山引擎 FORCE 大会发布 Doubao 2.1 Pro,支持 128K 上下文、原生 Function Calling 与多步规划,在 HumanEval、SWE-bench Verified 及内部 Agent 任务基准上优于 Claude Opus 4.6;同步上线豆包"专业版"订阅(¥68/月)含后台自动执行办公任务模式。
③ OpenAI 向受控伙伴有限预览 GPT-5.6 系列(Sol / Terra / Luna)
GPT-5.6 据称上下文窗口扩至 150万 Token,编程与多跳推理显著增强,Terra 版性能对标 GPT-5.5 但价格减半。受美商务部要求,本次仅向经审核的少数合作伙伴提供有限预览,暂不广泛开放。
④ 美国商务部部分解除 Anthropic Claude Mythos 5 出口限制
美商务部致函 Anthropic,允许逾 100 家获批企业或联邦机构(含外籍雇员)访问 Claude Mythos 5,但旗舰模型 Fable 5 禁令暂未解除。此举被解读为美政府对前沿模型监管从"全面封锁"转向"白名单许可"模式。
⑤ 星海图开源具身智能 VLA 模型 G0.5 + 双足人形机器人 Kengo
具身智能公司星海图发布并开源统一自回归 VLA 基础模型 Galaxea G0.5,融合视觉-语言-动作生成,在六大具身基准居首;同步首秀全尺寸双足人形机器人 Kengo,推进具身智能"模型+本体"闭环。
⑥ 华为开源盘古 openPangu 2.0(6月30日起开放核心组件)
余承东官宣开源盘古 openPangu 2.0,支持 512K 超长上下文,深度适配昇腾算力(单卡吞吐达主流开源模型 2 倍),鸿蒙生态原生 Agent 调度。7大核心组件定于 6月30日起陆续开放。
📱 产品与应用(Product & Application)
• 新华社发布"新华语典"AI智能体:基于权威时政语料库构建,支持智能问答、知识库检索、订阅推送与智能体广场,标志官媒全面拥抱 Agent 范式。
• 科大讯飞发布企业服务 Claw 平台:多智能体协同(需求理解/方案生成/报价/推荐 Agent),一句话描述业务需求即可输出可落地方案,内置 AstronClaw 零门槛部署版与 130+ Skills。
• 腾讯云 WorkBuddy 企业版 + Agent Suite:7×24 数字员工、团队模式知识沉淀、原生接入腾讯文档/网盘/乐享,主打企业 AI-Native 组织转型。
• 兆企供应链开源 WorkMate 企业 Agent 框架:含 Harness 核心框架、10 个供应链 Skills 模板及 MCP SDK,聚焦报价/合同/风控/数据分析场景的可审计 Agent 底座。
• G7 易流发布穿戴式 AI 硬件"拍拍豆"(30g):下车自动录制、上车自动上传、AI 语音标签分类,专为货运物流交接留证设计。
• 中国移动灵犀人形机器人 MWC 26 点球夺冠:全自主攻防、自主导航、追球射门,展示具身智能在限定场景的实用化进展。
💻 硬件与算力(Hardware & Infrastructure)
• OpenAI × 博通发布首款自研推理 ASIC「Jalapeño」:专为 LLM 推理设计,OpenAI 负责架构、博通做硅实现,早期样片在实验室达标运行,每瓦性能优于当前主流 GPU,计划 2026 年起部署千兆瓦级数据中心。
• Google 正式对外出售自研 TPU + 50亿美元黑石算力中心协议:第三方首次可直接采购 Google TPU 芯片及配套硬件,并与黑石合建 500MW 算力中心,主打低价 Token 生成成本优势。
• Amazon AWS 洽谈对外出售 Trainium 芯片:定制成 ASIC 推理芯片从内部自用走向商业化,瞄准希望自建算力的大型企业客户。
• Tensordyne Napier AI 芯片(台积电 3nm)流片成功:1380亿晶体管、144GB HBM3E、峰值 2.1 PFLOPs,宣称 TDN72 机架 Token 吞吐较 Blackwell 高 17 倍,单机架可替代 9 套 NVIDIA Rubin 机架。
• 中国"灵晟"超算 ISC 2026 登顶全球第一:持续性能 2.19 EFlops,首次突破 2E Flops,搭载国产 HBM 高带宽存储,全链路自主可控。
• 高通发布数据中心 Dragonfly 产品组合:打入云端 AI 推理市场,已获 Meta、微软等客户意向,与英伟达/博通/AMD 在推理 ASIC 领域正面竞争。
💰 财经与投融资(Finance & M&A)
• DeepSeek 完成首轮外部融资超 500 亿元:估值突破 3300 亿元,资金将投向 V4 后续研发与国产算力生态建设,系国内大模型迄今最大单轮融资之一。
• Cursor(Anysphere)被 SpaceX/xAI 收购:马斯克以约 600 亿美元估值签署合并协议,Cursor 作独立品牌运营并全面接入 xAI Colossus 超算,预计 Q3 完成。
• 深度机智完成数亿元新一轮融资:国寿长三角科创基金领投,专注物理 AI 全栈(人类数据采集→模型→真机),两月内连续两轮。
• OpenAI / Anthropic / SpaceX 均秘密递交 S-1 IPO 申请:Anthropic H 轮后估值 9650 亿美元,OpenAI 估值约 8520 亿美元,SpaceX 已完成史上最大规模 IPO 筹资 750 亿美元。
• 科创板第五套标准扩围至 AI 大模型企业:证监会明确未盈利 AI 大模型公司可适用,智谱华章、MiniMax、燧原科技等科创板 IPO 进程提速。
• 国家市监总局发布《人工智能智能体互联》7 项国家标准:统一智能体身份码、发现、交互与工具调用协议,小米、联想等百余家企业参与试点——标准化本身也在催化 Agent 生态投资预期。
🔮 编辑观点与趋势判断
1. 推理降本成新主战场:DeepSeek DSpark 开源 + V4 Pro 降价、Google TPU 对外销售、OpenAI Jalapeño ASIC 流片,说明行业重心已从"参数军备竞赛"全面转向"每 Token 成本与延迟优化",推理效率将成下一阶段核心竞争力。
2. 模型层"去神秘化",应用层"Agent 工业化":国标发布+多企业开源 Agent 框架(WorkMate/Claw/WorkBuddy),意味着智能体开始有统一通信协议与审计规范,2026 下半年将看到跨平台 Multi-Agent 系统在企业侧规模落地。
3. 算力格局三分天下:NVIDIA GPU(训练+高端推理)仍占主导,但 Cloud TPU/Trainium/Jalapeño ASIC 在推理侧快速侵蚀份额,叠加国产昇腾+灵晟超算突破,全球 AI 算力供应链多元化不可逆。
4. 资本向"全栈+具身"聚集:DeepSeek 巨额融资、Cursor 被收编、具身智能(星海图/深度机智)获青睐,投资逻辑正从"买模型公司"转向"买能控制数据-模型-本体全链路或能深度绑定超级算力生态的玩家"。
夜雨聆风