豆包专业版来了:68 元买个会自己操作电脑的 AI|OpenAI 自研推理芯片亮相|GPT-5.5 更懂你【AI早报 2026-06-25】

AI 早报 2026-06-25

概览

要闻

GPT-5.5 Instant 大更新：OpenAI 最常用的模型变得更「懂你」，今日付费、明日免费全量
OpenAI 首款自研芯片 Jalapeño 亮相：联手博通为大模型推理打造，9 个月完成流片

模型发布

阿里通义千问开源 Qwen-AgentWorld：把「语言世界模型」做成 agent 训练场
百度 Unlimited-OCR 登上 HuggingFace 趋势榜

产品应用

字节豆包推出专业版：接入豆包 2.1 Pro，68 元起，办公模式可授权操作本地电脑
Kimi API 上线 AWS Marketplace：可合并计费、抵扣 AWS EDP 承诺额
GPT-5 帮免疫学家解开三年悬而未决的 T 细胞谜题

技术与洞察

HuggingFace 推出 FFASR 排行榜：在真实场景里给语音识别打分

行业动态

NVIDIA 发布 Agent Toolkit：整合 Nemotron 开源模型 + 工具 + 安全运行时

🎙 本周推荐播客

构建一所让 AI 模型学习人文的学校

要闻

GPT-5.5 Instant 大更新：OpenAI 最常用的模型变得更「懂你」，今日付费、明日免费全量

OpenAI 发布新版 GPT-5.5 Instant，称这是其使用量最大的模型，在理解提问意图、按需调整回答、处理多重复杂约束方面更可靠，购物与本地生活推荐也更连贯实用。新版 6 月 24 日先向付费用户推送，6 月 25 日向免费用户开放。

模型定位：GPT-5.5 Instant 是 ChatGPT 默认的快速响应模型，覆盖绝大多数日常对话，是 OpenAI 使用量最大的模型

能力升级：更准确理解提问背后的意图并据此调整回答，对多重复杂约束的处理更稳定

场景改进：购物与本地生活推荐更连贯、更可用

推送节奏：6 月 24 日先到 Pro / Plus 付费用户，免费用户 6 月 25 日跟上

https://x.com/OpenAI/status/2069843083701915755

OpenAI 首款自研芯片 Jalapeño 亮相：联手博通为大模型推理打造，9 个月完成流片

OpenAI 与博通（Broadcom）联合发布 Jalapeño，这是 OpenAI 首款定制 AI 推理芯片，专为 LLM 推理设计，从初始设计到流片仅用 9 个月。芯片由博通制造、OpenAI 用于在 ChatGPT 等产品中服务模型，官方称单位功耗性能大幅优于当前最先进水平，计划 2026 年底首批部署。

产品定位：OpenAI 首款「Intelligence Processor」推理加速器，是双方多代计算平台的第一代产品

研发速度：从设计到流片仅 9 个月，号称高性能先进半导体史上最快 ASIC 周期之一，部分设计/优化用 OpenAI 自家模型加速

性能指标：早期测试显示单位功耗性能显著优于当前最先进芯片

部署计划：2026 年底首批上线，目标与微软等伙伴部署吉瓦级数据中心

https://techcrunch.com/2026/06/24/openai-unveils-its-first-custom-chip-built-by-broadcom/

模型发布

阿里通义千问开源 Qwen-AgentWorld：把「语言世界模型」做成 agent 训练场

阿里通义千问发布并开源 Qwen-AgentWorld，一类以「环境建模」为训练目标的原生语言世界模型——它不直接在终端或浏览器里行动，而是预测环境会返回什么，相当于给 AI agent 当「飞行模拟器」。配套基准 AgentWorldBench 已在 HuggingFace 开源，旗舰版据称在七大领域的模拟质量上超过 GPT-5.4 与 Claude Opus 4.8，采用 Apache 2.0 许可。

核心思路：用语言世界模型预测环境响应，替代让 agent 直接在真实终端/浏览器试错的高成本路径

评测表现：旗舰 Qwen-AgentWorld-397B-A17B 据称在 MCP / Search / Terminal / 软件工程 / Android / Web / OS 七域 AgentWorldBench 上领先 GPT-5.4、Claude Opus 4.8（厂商口径）

开源力度：模型与 AgentWorldBench 基准均开源，采用 Apache 2.0，可商用微调

配套生态：接入团队已有的 Qwen-Agent 开源框架，AgentWorld 充当其中的「模拟层」

https://github.com/QwenLM/Qwen-AgentWorld

百度 Unlimited-OCR 登上 HuggingFace 趋势榜

百度开源的多模态 OCR 模型 Unlimited-OCR 登上 HuggingFace 趋势榜，定位 image-text-to-text 任务，上线后下载量迅速破 4.5 万。

任务定位：image-text-to-text 的端到端 OCR，面向文档/图像文字识别

热度数据：HuggingFace 趋势榜在榜，下载约 4.5 万、点赞 700+

来源厂商：由百度开源发布

https://huggingface.co/baidu/Unlimited-OCR

产品应用

字节豆包推出专业版：接入豆包 2.1 Pro，68 元起，办公模式可授权操作本地电脑

字节跳动旗下豆包正式推出付费专业版，接入豆包 2.1 系列旗舰模型，标准套餐连续包月 68 元起、最高 500 元，并新增可执行 agent 任务的办公任务模式——在用户授权下可直接操作本地电脑与浏览器，协助使用本地应用、整理资料、处理文档。官方强调搜索问答、写作生图、语音视频对话等基础功能永久免费。

套餐定价：标准版连续包月 68 元、最高档 500 元，在校大学生特惠 38 元

模型升级：付费版接入旗舰 豆包 2.1 Pro，额度提升至免费版 5 倍以上

核心新功能：办公任务模式支持 agent 在授权后操作本地电脑/浏览器、跨应用整理资料与处理文档

免费承诺：官方表态基础高频功能永久免费，不通过「降智」倒逼付费

https://www.ithome.com/0/967/743.htm

Kimi API 上线 AWS Marketplace：可合并计费、抵扣 AWS EDP 承诺额

月之暗面宣布 Kimi API 正式上线 AWS Marketplace，已在 AWS 上运行的团队可通过合并计费直接调用 Kimi，符合条件的客户还能把 Kimi 用量计入 AWS EDP（企业折扣计划）承诺额。

上线渠道：Kimi API 进入 AWS Marketplace，面向已在 AWS 的企业团队

计费便利：支持合并计费，并可将用量抵扣 AWS EDP 承诺消费额

战略意义：国内模型借海外云市场触达企业客户，降低接入与采购门槛

https://x.com/Kimi_Moonshot/status/2069718757338202140

GPT-5 帮免疫学家解开三年悬而未决的 T 细胞谜题

OpenAI 公布一则案例：GPT-5 Pro 帮助免疫学家 Derya Unutmaz 解开一个困扰三年的 T 细胞行为谜题，相关洞见有望支持癌症与自身免疫疾病研究。

具体成果：协助理解一项悬置三年的 T 细胞行为机制问题

使用模型：由 GPT-5 Pro 完成关键推理与假设生成

潜在影响：洞见指向癌症与自身免疫疾病研究方向

https://openai.com/index/gpt-5-immunology-mystery

技术与洞察

HuggingFace 推出 FFASR 排行榜：在真实场景里给语音识别打分

HuggingFace 发布 FFASR 排行榜，针对「真实世界」语音识别（远场、噪声、口音等复杂条件）建立基准，弥补传统干净语料评测与实际部署之间的差距。

评测目标：聚焦真实场景 ASR（远场/噪声/口音），而非干净朗读语料

价值定位：把「实验室分数高、落地翻车」的差距显式量化

评测形式：公开 leaderboard，便于横向比较各家 ASR 模型

https://huggingface.co/blog/ffasr-leaderboard

行业动态

NVIDIA 发布 Agent Toolkit：整合 Nemotron 开源模型 + 工具 + 安全运行时

NVIDIA 推出 Agent Toolkit，把开源 Nemotron 模型、工具、技能与安全运行时整合在一起，帮助企业构建面向自身工作流的领域专用 agent。

组成模块：开源 Nemotron 模型 + 工具/技能库 + 安全运行时支持

目标场景：企业搭建领域专用 agent，从「通用试点」转向贴合自身工作流的系统

行业背景：第一波企业 AI 是「接入」，这一波转向「专门化 agent」

https://blogs.nvidia.com/blog/nvidia-agent-toolkit-open-models-tools-skills-secure-runtime-ai-agents/

🎙 本周推荐播客

构建一所让 AI 模型学习人文的学校

Surge AI CEO Edwin Chen 相信 Scaling Law 仍成立，并阐述如何通过系统化的人文数据训练让下一代 AI 模型更好地理解人类价值观。讨论 RLHF 数据质量、标注者素质与模型价值观对齐的关系。

频道：Every｜⏱ 43:49

核心主题：高质量人文数据对 AI 价值观对齐的作用，以及数据标注的专业化路径

嘉宾视角：Edwin Chen，Surge AI CEO，RLHF 数据供应商创始人，产业内部人

关键观点：标注者的人文素养直接影响模型行为，「低质量人力」是对齐失败的结构性原因

适合听众：关注 AI 对齐、RLHF 数据质量与 AI 伦理实践的从业者

https://www.youtube.com/watch?v=omX6wrLuX08

欢迎关注 苍痕Luca B站账号，同步更新每日 AI 视频资讯。