乐于分享
好东西不私藏

AI日报 |2026年05月07日 GPT-5.5 Instant 全员免费 · 谷歌Remy Agent · 美国政府预审

AI日报 |2026年05月07日 GPT-5.5 Instant 全员免费 · 谷歌Remy Agent · 美国政府预审

今天可能是2026年普通用户离AI变革最近的一天。不是因为哪个实验室发了论文,而是你手机里那个沉默的ChatGPT,悄悄换了颗心脏。

昨晚深夜,OpenAI 把 ChatGPT 的默认模型全量升级为 GPT-5.5 Instant —— 不是给开发者、不是给付费用户,是所有免费用户一起推。一家公司给数亿人同时发了一次免费体检,结果很惊人:幻觉直接砍半。


编程篇

一、GPT-5.5 Instant全员免费上线:幻觉暴降52%、数学飙到81分

OpenAI 昨晚正式将 ChatGPT 默认模型升级为 GPT-5.5 Instant。和上一代 GPT-5.3 Instant 相比,这次更新不是挤牙膏——几个关键数据摆出来你就懂了:

  • 幻觉率:高风险领域暴降 52.5%,用户标记”事实错误”场景减少 37.3%
  • 数学能力:AIME 2025 从 65.4% 飙升到 81.2%
  • 回复字数:直接砍掉 30.2%,减少无意义表情和废话
  • 个性化记忆:能主动调用聊天记录和 Gmail 内容,新增”记忆来源”管理面板

更重要的是,Sam Altman 宣布全员免费。Plus 和 Pro 用户还多了一份额外福利:三个月内可手动切回 5.3 Instant,之后老版本正式退役。

市场影响:这是 OpenAI 2026 年影响面最大的一次模型更新。数亿免费用户直接涌入最强默认模型,意味着 GPT-5.5 系列在三阶段定位(Instant 日常 / Pro 深度 / Ultra 极限)中彻底站稳。对于竞品 Claude、Grok 而言,ChatGPT 不再只是”最初的聊天机器人”——它是准确、简洁、懂你的私人助理。

使用建议:普通用户无需任何操作,打开 ChatGPT 就能体验。开发者和企业用户注意:API 模型 ID 已更新为 chat-latest,建议尽快对新模型进行回归测试,特别是对输出格式有严格要求的场景。老版本三个月退役,预留好迁移时间。

二、谷歌秘密内测AI智能体 Remy

谷歌正在为其 Gemini 大模型开发代号为 “Remy” 的个人 AI 智能体,定位直接对标 OpenAI 的 OpenClaw。Remy 能自主操作电脑、执行多步骤任务、跨应用协作。这是谷歌在 Agent 赛道上最认真的一次出手,但具体上线时间尚未公布。

三、美国政府宣布干预新AI模型发布

美国商务部 AI 标准与创新中心(CAISI)宣布,谷歌 DeepMind、微软和 xAI 已同意加入模型发布前的政府审核机制。这意味着五大前沿实验室(包括此前已签约的 OpenAI 和 Anthropic)全部纳入 AI 安全预审流程。新版模型在推向公众前,必须先通过联邦安全评估。

四、Anthropic 搞了个”全是AI的闲鱼群”

Anthropic 做了一场有趣的实验:让多个 AI 智能体在闲鱼场景中自主讨价还价。双方 AI 完成三轮谈判,最终以 280 元成交。这看起来像”AI 行为艺术”,但背后是对 Agent 自主交易能力的关键测试——当 AI 学会谈判,电商、客服、供应链的自动化门槛都会降一大截。


生图篇

过去24小时,AI生图领域没有重大新闻。GPT Image 2 已在各场景持续渗透,生图领域的下一轮爆发可能来自 Midjourney 和 Stable Diffusion 的新版本更新。小编会持续关注。


视频篇

过去24小时,AI视频领域同样安静。上一期报道的恒星 AI 的 Starfilm 和 Pixelle-Video 开源项目仍在发酵中,HappyHorse 正式商用进入倒计时。视频领域的竞品发布会可能是下一个观测窗口。


小编说

今天编程篇的新闻密度是近期最高的一次。

GPT-5.5 Instant 全员免费,不只是简单的能力升级——它意味着”AI 能力平权”又往前推了一大步。过去你在付费墙后面才能享受的精准回答,现在是所有人的默认选项。这对中小企业、个人创作者、甚至学生群体都是一个信号:不要等到”AI更强了再用”,因为最强的那版已经在你的手机里了。

同时,美国政府介入模型发布前审核,说明 AI 的安全治理已经从”口头承诺”进入”硬机制”阶段。未来半年,模型上线节奏可能会放缓,但长期看,规范化的审核反而是好事——减少翻车,才能建立真正的信任。


今日金句

“每一点改进乘以数亿用户,就是基本面重写。”