AI 早报 2026-06-25
概览
要闻
GPT-5.5 Instant 大更新:OpenAI 最常用的模型变得更「懂你」,今日付费、明日免费全量 OpenAI 首款自研芯片 Jalapeño 亮相:联手博通为大模型推理打造,9 个月完成流片
模型发布
阿里通义千问开源 Qwen-AgentWorld:把「语言世界模型」做成 agent 训练场 百度 Unlimited-OCR 登上 HuggingFace 趋势榜
产品应用
字节豆包推出专业版:接入豆包 2.1 Pro,68 元起,办公模式可授权操作本地电脑 Kimi API 上线 AWS Marketplace:可合并计费、抵扣 AWS EDP 承诺额 GPT-5 帮免疫学家解开三年悬而未决的 T 细胞谜题
技术与洞察
HuggingFace 推出 FFASR 排行榜:在真实场景里给语音识别打分
行业动态
NVIDIA 发布 Agent Toolkit:整合 Nemotron 开源模型 + 工具 + 安全运行时
🎙 本周推荐播客
构建一所让 AI 模型学习人文的学校
要闻
GPT-5.5 Instant 大更新:OpenAI 最常用的模型变得更「懂你」,今日付费、明日免费全量
OpenAI 发布新版 GPT-5.5 Instant,称这是其使用量最大的模型,在理解提问意图、按需调整回答、处理多重复杂约束方面更可靠,购物与本地生活推荐也更连贯实用。新版 6 月 24 日先向付费用户推送,6 月 25 日向免费用户开放。
模型定位:GPT-5.5 Instant 是 ChatGPT 默认的快速响应模型,覆盖绝大多数日常对话,是 OpenAI 使用量最大的模型
能力升级:更准确理解提问背后的意图并据此调整回答,对多重复杂约束的处理更稳定
场景改进:购物与本地生活推荐更连贯、更可用
推送节奏:6 月 24 日先到 Pro / Plus 付费用户,免费用户 6 月 25 日跟上
https://x.com/OpenAI/status/2069843083701915755
OpenAI 首款自研芯片 Jalapeño 亮相:联手博通为大模型推理打造,9 个月完成流片
OpenAI 与博通(Broadcom)联合发布 Jalapeño,这是 OpenAI 首款定制 AI 推理芯片,专为 LLM 推理设计,从初始设计到流片仅用 9 个月。芯片由博通制造、OpenAI 用于在 ChatGPT 等产品中服务模型,官方称单位功耗性能大幅优于当前最先进水平,计划 2026 年底首批部署。
产品定位:OpenAI 首款「Intelligence Processor」推理加速器,是双方多代计算平台的第一代产品
研发速度:从设计到流片仅 9 个月,号称高性能先进半导体史上最快 ASIC 周期之一,部分设计/优化用 OpenAI 自家模型加速
性能指标:早期测试显示单位功耗性能显著优于当前最先进芯片
部署计划:2026 年底首批上线,目标与微软等伙伴部署吉瓦级数据中心
https://techcrunch.com/2026/06/24/openai-unveils-its-first-custom-chip-built-by-broadcom/
模型发布
阿里通义千问开源 Qwen-AgentWorld:把「语言世界模型」做成 agent 训练场
阿里通义千问发布并开源 Qwen-AgentWorld,一类以「环境建模」为训练目标的原生语言世界模型——它不直接在终端或浏览器里行动,而是预测环境会返回什么,相当于给 AI agent 当「飞行模拟器」。配套基准 AgentWorldBench 已在 HuggingFace 开源,旗舰版据称在七大领域的模拟质量上超过 GPT-5.4 与 Claude Opus 4.8,采用 Apache 2.0 许可。
核心思路:用语言世界模型预测环境响应,替代让 agent 直接在真实终端/浏览器试错的高成本路径
评测表现:旗舰 Qwen-AgentWorld-397B-A17B 据称在 MCP / Search / Terminal / 软件工程 / Android / Web / OS 七域 AgentWorldBench 上领先 GPT-5.4、Claude Opus 4.8(厂商口径)
开源力度:模型与 AgentWorldBench 基准均开源,采用 Apache 2.0,可商用微调
配套生态:接入团队已有的 Qwen-Agent 开源框架,AgentWorld 充当其中的「模拟层」
https://github.com/QwenLM/Qwen-AgentWorld
百度 Unlimited-OCR 登上 HuggingFace 趋势榜
百度开源的多模态 OCR 模型 Unlimited-OCR 登上 HuggingFace 趋势榜,定位 image-text-to-text 任务,上线后下载量迅速破 4.5 万。
任务定位:image-text-to-text 的端到端 OCR,面向文档/图像文字识别
热度数据:HuggingFace 趋势榜在榜,下载约 4.5 万、点赞 700+
来源厂商:由百度开源发布
https://huggingface.co/baidu/Unlimited-OCR
产品应用
字节豆包推出专业版:接入豆包 2.1 Pro,68 元起,办公模式可授权操作本地电脑
字节跳动旗下豆包正式推出付费专业版,接入豆包 2.1 系列旗舰模型,标准套餐连续包月 68 元起、最高 500 元,并新增可执行 agent 任务的办公任务模式——在用户授权下可直接操作本地电脑与浏览器,协助使用本地应用、整理资料、处理文档。官方强调搜索问答、写作生图、语音视频对话等基础功能永久免费。
套餐定价:标准版连续包月 68 元、最高档 500 元,在校大学生特惠 38 元
模型升级:付费版接入旗舰 豆包 2.1 Pro,额度提升至免费版 5 倍以上
核心新功能:办公任务模式支持 agent 在授权后操作本地电脑/浏览器、跨应用整理资料与处理文档
免费承诺:官方表态基础高频功能永久免费,不通过「降智」倒逼付费
https://www.ithome.com/0/967/743.htm
Kimi API 上线 AWS Marketplace:可合并计费、抵扣 AWS EDP 承诺额
月之暗面宣布 Kimi API 正式上线 AWS Marketplace,已在 AWS 上运行的团队可通过合并计费直接调用 Kimi,符合条件的客户还能把 Kimi 用量计入 AWS EDP(企业折扣计划)承诺额。
上线渠道:Kimi API 进入 AWS Marketplace,面向已在 AWS 的企业团队
计费便利:支持合并计费,并可将用量抵扣 AWS EDP 承诺消费额
战略意义:国内模型借海外云市场触达企业客户,降低接入与采购门槛
https://x.com/Kimi_Moonshot/status/2069718757338202140
GPT-5 帮免疫学家解开三年悬而未决的 T 细胞谜题
OpenAI 公布一则案例:GPT-5 Pro 帮助免疫学家 Derya Unutmaz 解开一个困扰三年的 T 细胞行为谜题,相关洞见有望支持癌症与自身免疫疾病研究。
具体成果:协助理解一项悬置三年的 T 细胞行为机制问题
使用模型:由 GPT-5 Pro 完成关键推理与假设生成
潜在影响:洞见指向癌症与自身免疫疾病研究方向
https://openai.com/index/gpt-5-immunology-mystery
技术与洞察
HuggingFace 推出 FFASR 排行榜:在真实场景里给语音识别打分
HuggingFace 发布 FFASR 排行榜,针对「真实世界」语音识别(远场、噪声、口音等复杂条件)建立基准,弥补传统干净语料评测与实际部署之间的差距。
评测目标:聚焦真实场景 ASR(远场/噪声/口音),而非干净朗读语料
价值定位:把「实验室分数高、落地翻车」的差距显式量化
评测形式:公开 leaderboard,便于横向比较各家 ASR 模型
https://huggingface.co/blog/ffasr-leaderboard
行业动态
NVIDIA 发布 Agent Toolkit:整合 Nemotron 开源模型 + 工具 + 安全运行时
NVIDIA 推出 Agent Toolkit,把开源 Nemotron 模型、工具、技能与安全运行时整合在一起,帮助企业构建面向自身工作流的领域专用 agent。
组成模块:开源 Nemotron 模型 + 工具/技能库 + 安全运行时支持
目标场景:企业搭建领域专用 agent,从「通用试点」转向贴合自身工作流的系统
行业背景:第一波企业 AI 是「接入」,这一波转向「专门化 agent」
https://blogs.nvidia.com/blog/nvidia-agent-toolkit-open-models-tools-skills-secure-runtime-ai-agents/
🎙 本周推荐播客
构建一所让 AI 模型学习人文的学校
Surge AI CEO Edwin Chen 相信 Scaling Law 仍成立,并阐述如何通过系统化的人文数据训练让下一代 AI 模型更好地理解人类价值观。讨论 RLHF 数据质量、标注者素质与模型价值观对齐的关系。
频道:Every|⏱ 43:49
核心主题:高质量人文数据对 AI 价值观对齐的作用,以及数据标注的专业化路径
嘉宾视角:Edwin Chen,Surge AI CEO,RLHF 数据供应商创始人,产业内部人
关键观点:标注者的人文素养直接影响模型行为,「低质量人力」是对齐失败的结构性原因
适合听众:关注 AI 对齐、RLHF 数据质量与 AI 伦理实践的从业者
https://www.youtube.com/watch?v=omX6wrLuX08
欢迎关注 苍痕Luca B站账号,同步更新每日 AI 视频资讯。
夜雨聆风