AI 行业早报 · 2026年6月25日 周四
今日精选 18 条 AI 动态,涵盖大模型竞速 · 算力新局 · 产品落地 · 观点交锋 · 前沿探索
🆕 大模型竞速
ChatGPT Bidi 1 上线测试:语音对话进入双向时代
OpenAI 悄然上线了名为 Bidi 1 的双向 AI 语音模型,在 ChatGPT 网页版和 App 版的模型选择器中,与标准语音和高级语音并列。该模型最大亮点在于支持「边说边听」——用户可在对话中途打断并发出新指令,模型会立即切换执行,实现了更接近真人交谈的并行交互体验。目前 OpenAI 尚未官宣,预计本周启动更大范围测试。
IT之家[1]
GPT-5.5 Instant 新版本推送:理解力与趣味性双提升
OpenAI 向付费用户推送了新版 GPT-5.5 Instant,新版本在对话趣味性和意图理解上明显增强,能更准确地把握问题背后的真实需求并调整回应风格。同时,模型在处理购物推荐、本地信息等复杂约束场景中也更加可靠连贯。免费用户将从明天起陆续收到更新。
X:OpenAI[2]
通义千问开源 AgentWorld:让智能体学会「先预测再行动」
通义实验室推出首个原生语言世界模型 Qwen-AgentWorld,覆盖 MCP、搜索、终端、代码、Web、OS、Android 七大领域。模型基于超 1000 万条真实交互轨迹,经过 CPT→SFT→RL 三阶段训练,在 AgentWorldBench 上以 58.71 分超越 GPT-5.4 和 Claude Opus 4.8。该模型既能作为解耦环境模拟器实现可控的 Sim RL,也能作为智能体基础模型迁移至多个未见基准。
公众号:通义实验室[3]
Gemini 3.5 Flash 原生集成计算机使用能力
Google 将计算机使用(Computer Use)作为内置工具整合进 Gemini 3.5 Flash,此前这一能力仅作为独立模型提供。开发者现可通过 Gemini API 和 Enterprise Agent Platform 构建跨浏览器、移动端和桌面的自主智能体。安全方面,模型采用了针对性对抗训练降低提示注入风险,并新增用户确认敏感操作和自动拦截间接注入两项企业级保护。在持续软件测试和跨应用知识工作等长周期自动化场景中表现尤为突出。
Hacker News[4]
⚡ 算力新局
OpenAI 联手博通发布 LLM 专用推理芯片 Jalapeño
OpenAI 与博通联合推出首款自研 AI 加速器 Jalapeño,这是专为大语言模型推理从头设计的定制芯片,非通用加速器的改版。工程样片已在实验室以目标频率和功耗运行 ML 负载,初测显示每瓦性能大幅领先当前顶尖方案。从设计到流片仅用了 9 个月,OpenAI 模型全程参与加速了设计与优化。Jalapeño 将与微软等合作伙伴在 GW 级数据中心首批部署,计划 2026 年底上线。
OpenAI 官网[5]
火山引擎推出 Agent Ready 企业智能基础设施
在火山引擎 FORCE 大会上,AgentKit 与 ArkClaw 企业版同步升级,构建了 AI 云与 Agent 三层架构。AgentKit 新增身份认证、运行时沙箱、评估等模块,主打 Agent 的可靠、可控、可观测三大能力。这意味着企业不再需要从零搭建智能体基础设施,可直接在火山引擎平台上部署和管理大规模 AI Agent 应用。
公众号:火山引擎[6]
NVIDIA NeMo AutoModel:一行代码加速 MoE 大模型微调
NVIDIA 推出基于 Transformers v5 的开源库 NeMo AutoModel,通过引入 Expert Parallelism、DeepEP 融合通信调度与 TransformerEngine 内核,大幅加速 MoE 架构模型的微调流程。开发者无需深入底层并行策略,只需一行代码即可激活全栈加速,将大模型微调从少数专家的手艺活变成了更多团队可上手的工程实践。
Hugging Face Blog[7]
🚀 产品落地
豆包专业版正式上线:AI 办公进入 Agent 驱动时代
字节跳动旗下豆包正式推出专业版,基于豆包 2.1 系列大模型,核心卖点是全新办公任务模式——AI 不仅能回答问题,还能操作本地电脑和浏览器、调用 Skills 技能、定时执行工作,内置 Office 办公套件并可生成带后端数据库的在线应用。定价为连续包月 68 元起,学生认证可享 38 元专属折扣。免费用户也能体验接入豆包 2.1 Turbo 的办公任务模式。
公众号:豆包[8]
Figma Config 2026 押注人类判断力,画布扩展至代码与 3D
在旧金山年度大会上,Figma 将设计画布从静态布局扩展到代码、动画、3D 深度和着色器效果。Code Layers 让设计与代码同屏并存,Motion 将动画纳入协作工作流,Shader 则通过 WebGPU 实现磨砂玻璃、金属质感等效果。Figma 明确将「人类判断力」作为差异化定位——AI 可以生成,但决策与审美仍由人掌控。然而其 AI 能力来自 Anthropic 等第三方模型,后者已推出 Claude Design 构成直接竞争。
The Decoder[9]
Notion 嵌入 Cursor 编码智能体,数周完成集成
Notion 利用 Cursor SDK 在数周内将编码智能体嵌入产品,用户可在文档中 @Cursor、在讨论串中提及或向数据库指派编码任务,Cursor 即可端到端完成规划、构建、测试、验证并自动创建 PR。Notion 工程师表示,Cursor SDK 的模型设计与自身产品架构高度契合,集成仅需薄适配层,大幅节省了自建 Agent 基础设施的成本。
Cursor Blog[10]
OpenRouter 零数据留存覆盖 97 款模型,流量占比近半
OpenRouter 披露其零数据留存(ZDR)实践成果:自今年 1 月以来新增 97 款支持 ZDR 的模型,月度 token 量增长 4.3 倍,约占全部路由流量的一半。ZDR 在三个层面执行——账户级、模型级和请求级,确保用户提示词和模型响应不被存储,为注重隐私的企业用户和开发者提供了更可靠的 API 路由方案。
OpenRouter Blog[11]
💡 观点交锋
里德·霍夫曼炮轰:SpaceX 不是 AI 公司,xAI 是「彻底灾难」
LinkedIn 联合创始人、OpenAI 与 Anthropic 投资人 Reid Hoffman 在播客中直言,SpaceX「不是一家 AI 公司」,其收购 Cursor 属于「花钱买相关性」;xAI 则是「一场彻底的灾难」,所有联合创始人均已出走,正在经历「第三次重启」。他还批评美国政府叫停 Anthropic 的 Mythos 模型是「专横随性」的监管,缺乏可预测的规则。Hoffman 同时认为 OpenAI 和 Anthropic 有足够空间共赢,AI 市场并非零和博弈。
Fortune[12]
字节洪定坤:AI 代码贡献率可能严重失真
在火山引擎 FORCE 大会上,字节跳动技术副总裁洪定坤分享了 AI Coding 的冷静反思。尽管字节过去一年 AI 代码贡献率增长 6 倍、tokens 消耗增长 5 倍,但他指出 TRAE 团队 90% 以上代码由 AI 生成,人均需求吞吐率仅提升 60%,远低于代码生成速度的 10 倍理论上限。单一指标会掩盖真实效率瓶颈——Vibe Coding 可能感觉快了但实际更慢。他强调 AI Coding 真正的挑战在于基建(Harness):上下文工程、架构约束、团队知识沉淀和治理流程。
公众号:火山引擎[13]
数据打脸 AI 裁员论:工程岗是 2025 年最具韧性职业
风投机构 SignalFire 追踪 8000 万家公司、数百万员工数据发现,尽管科技公司总招聘较 2019 年下降 25%,工程岗仅下降 11%。在 Alphabet、Meta 等 12 家科技巨头的新招员工中,工程师占比从 2019 年的 46% 跃升至 55%。早期创业公司招聘工程师的数量甚至比 2019 年增长了 7%。NVIDIA CEO 黄仁勋更直接反驳 AI 取代工程师的说法,称在全员使用 Agent AI 后,「软件工程师比以往任何时候都更忙」。
TechCrunch[14]
因与 Anthropic 纠纷,NSA 失去 Mythos 系统访问权
美国国家安全局因与 Anthropic 的纠纷,被切断了对其 Mythos 系统的访问权限。这一事件与美政府此前以出口管制为由叫停 Anthropic 的 Fable 和 Mythos 模型形成连锁反应。Reid Hoffman 在同一访谈中批评此举缺乏可预测的规则,属于「找茬式」执法。该事件引发了对 AI 公司与政府机构合作模式以及监管边界的广泛讨论。
Hacker News[15]
📚 前沿探索
DFlash 投机解码突破:单次前向生成整块 Token,吞吐量最高提升 15 倍
UCSD 团队提出 DFlash,一种轻量块扩散草稿模型,一次前向推理即可生成整块 token,再由目标模型并行验证保证无损输出。相比当前最优的 EAGLE-3,DFlash 实现最高 2.5 倍加速;在 NVIDIA Blackwell DGX B300 上运行 gpt-oss-120b 时,吞吐量最高提升 15 倍。核心创新在于将目标模型的隐藏特征注入草稿模型的每一层 KV 缓存中,让接受长度随草稿深度线性增长。
MarkTechPost[16]
Google 研究发现:推理能解锁大模型隐藏的「参数化知识」
Google Research 在 Gemini 2.5 Flash/Pro 和 Qwen3-32B 上发现,启用推理后模型能回答大量此前无法正确回忆的简单事实性问题。研究揭示了两个驱动机制:一是「计算缓冲」——额外生成的推理 token 提供了更多前向计算机会;二是「事实启动」——推理过程中生成的关联事实充当语义预热,辅助正确答案的检索。但研究也警告,一旦推理链中出现幻觉事实,正确答案概率会显著下降。
Google Research Blog[17]
Mistral 为 Connectors 推出多项安全与可控新能力
Mistral AI 发布了 Connectors 的多项增强功能:增强管理控制台支持按工作空间设置连接器访问权限、API 密钥与连接器范围绑定、可配置的共享策略等。这些更新让企业用户能够在享受 AI 连接外部数据源便利的同时,保持精细的权限管控和合规审计能力,标志着企业级 AI 部署从「能不能用」进入「怎么安全地用好」的新阶段。
Mistral AI 官网[18]
以上,AI 行业今日速览。 作者:卡夫卡卡不卡
引用链接
[1]IT之家: https://www.ithome.com/0/967/852.htm
[2]X:OpenAI: https://x.com/OpenAI/status/2069843083701915755
[3]公众号:通义实验室: https://mp.weixin.qq.com/s/NV9WGpGsfFz35jww5agM9g
[4]Hacker News: https://blog.google/innovation-and-ai/models-and-research/gemini-models/introducing-computer-use-gemini-3-5-flash
[5]OpenAI 官网: https://openai.com/index/openai-broadcom-jalapeno-inference-chip
[6]公众号:火山引擎: https://mp.weixin.qq.com/s/83mrPAPgQRKhxLkoSvRgBQ
[7]Hugging Face Blog: https://huggingface.co/blog/nvidia/accelerating-fine-tuning-nvidia-nemo-automodel
[8]公众号:豆包: https://mp.weixin.qq.com/s/Sb-NMXTrWFQES1EDO_Gr2g
[9]The Decoder: https://the-decoder.com/figma-bets-on-human-judgment-at-config-2026-while-the-ai-powering-its-canvas-belongs-to-someone-else
[10]Cursor Blog: https://cursor.com/blog/notion
[11]OpenRouter Blog: https://openrouter.ai/blog/insights/when-zero-means-zero
[12]Fortune: https://fortune.com/2026/06/24/reid-hoffman-spacex-musk-openai-anthropic-gen-z-mistake
[13]公众号:火山引擎: https://mp.weixin.qq.com/s/mdmaAyUIvxE8WT_GEbF2wQ
[14]TechCrunch: https://techcrunch.com/2026/06/24/ai-was-supposed-to-kill-engineering-jobs-but-new-data-suggests-theyre-the-most-resilient
[15]Hacker News: https://www.nytimes.com/2026/06/23/us/politics/nsa-lost-access-anthropic-tool.html
[16]MarkTechPost: https://www.marktechpost.com/2026/06/24/dflash-speculative-decoding-drafts-whole-token-blocks-in-parallel-for-up-to-15x-higher-throughput-on-nvidia-blackwell
[17]Google Research Blog: https://research.google/blog/thinking-to-recall-how-reasoning-unlocks-parametric-knowledge-in-llms
[18]Mistral AI 官网: https://mistral.ai/news/more-control-over-connectors
夜雨聆风