OpenAI发布GPT-5.5 Instant:幻觉率降低52.5%,模型更简洁更懂你-夜雨聆风

OpenAI发布GPT-5.5 Instant:幻觉率降低52.5%,模型更简洁更懂你

OpenAI 正式推出了GPT-5.5 Instant，并将其设为 ChatGPT 的默认模型，取代了之前的 GPT-5.3 Instant，现已向所有用户开放。Instant 系列作为 ChatGPT 日常使用的主力模型，每天有数以亿计的用户在持续使用。官方表示，在这个规模下，即使是微小的改进，累积起来的效果也相当显著。这一版本聚焦于三大核心：更精准、更精炼、更个性化。

相比上一代，新模型在保持低延迟的同时，在准确性、回复风格和个性化能力上均实现了显著提升。准确性的提升在高风险领域尤为突出。内部测试数据显示，GPT-5.5 Instant 在医疗、法律、金融等领域的幻觉率较上一版本下降了 52.5%。针对用户此前标记过的错误对话，错误率也减少了 37.3%。除了文字问答，图片和照片的分析能力、理科问题的解答质量，以及判断何时主动调用搜索工具的能力，均有所改善。

数学和科学能力的升级幅度更为明显。在 AIME 2025 竞赛数学测试中，GPT-5.5 Instant 得分 81.2，而 GPT-5.3 Instant 仅为 65.4。博士级科学测试 GPQA 的得分从 78.5 升至 85.6，多模态推理基准 MMMU-Pro 的得分从 69.2 升至 76，科学图表理解 CharXiv 从 75 升至 81.6，文档解析错误率则从 14.6% 降至 12.5%。OpenAI 通过一道代数题展示了两个版本的差异。用户提交了一道根式方程的解题过程，询问是否正确。GPT-5.3 Instant 发现 x=3 代入原方程不成立后，直接判定「无实数解」，未再进行深入排查。GPT-5.5 Instant 同样发现 x=3 无效，但随后定位到用户展开 (x-1)² 时的具体错误，并给出了正确解答。回复风格也是此次更新的重点。新模型更加简洁，不再堆砌格式和表情符号，也减少了不必要的追问。官方以一个日常场景为例：询问如何委婉地让话多的同事少说点话。

GPT-5.3 Instant 给出了五种分类策略，还附上「不该做什么」清单，结构完整但略显过度。GPT-5.5 Instant 的回复字数减少了 30.2%，行数减少了 29.2%，语气更像朋友的建议，重点放在如何将问题引导至自己的专注需求上，而非对方的说话习惯。

个性化能力是此次更新的另一条主线。Plus 和 Pro 用户可以让模型调取历史对话、上传文件以及关联的 Gmail 内容，从而获得更贴合个人情况的回答，无需每次重新解释背景。官方展示了一个茶馆推荐的对比：GPT-5.3 Instant 只知道用户在旧金山，推荐了几家通用热门店。GPT-5.5 Instant 则从历史对话中找到用户常去 Asha Tea House、偏好高山茶而非重糖奶茶的记录，据此推荐了风格更匹配的 Ceré Tea 和 Song Tea & Ceramics，并说明了推荐理由。与此同时，所有消费者版本将上线「记忆来源（Memory sources）」功能。当回答用到个人背景信息时，用户可以看到具体调用了哪些历史对话或已保存的记忆条目，并可随时删除或修正过时内容。

例如，用户询问本周晚餐建议后，ChatGPT 根据「正在备战马拉松」「偏好清淡高蛋白饮食」「喜欢饼干」等记忆，推荐了味噌三文鱼碗，并在右侧 Sources 面板列出本次回答调用的记忆来源；用户还能对单条记忆标记相关或不相关、进行纠正、查看全部记忆，或直接删除该记忆。

OpenAI 表示，这个视图展示的是最相关的部分来源，不一定覆盖模型检索过的全部记录，后续会持续完善。不想被记录的用户也可以选择临时对话模式，该模式不会读取或更新任何记忆。分享对话时，对方看不到这些来源记录。GPT-5.3 Instant 将保留三个月供付费用户使用，之后正式下线。个性化功能目前向 Plus 和 Pro 用户的网页端开放，移动端及免费、Go、企业等版本的推送计划在未来几周内陆续跟进，具体功能因地区而异。对开发者而言，GPT-5.5 Instant 已通过 API 以「chat-latest」名称提供。哦，对了，今天 OpenAI 也即将举行一场由 AI 发起的派对。奥特曼在 Stripe Sessions 的一场对谈里聊到，他在筹备 GPT-5.5 的上线派对时，顺手问了模型一句：你想要什么样的派对？模型认真给了一份清单。它希望派对定在美国当地时间 5 月 5 日，演讲环节越短越好，要有人类创造者上台致祝酒词，但它自己不想上台祝酒。

它还提议现场设一个专门收集 GPT-5.6 建议的环节，并把这些建议反馈给它自己。奥特曼说这些要求「很美好」，能让派对顺利进行。时间最终定在下午 5 点 55 分，也是模型自己的选择。而派对地点则定在 OpenAI 旧金山总部，非本地嘉宾的机票和酒店由 OpenAI 负责。

受邀名单由 Codex 从推文回复中筛选，报名链接于 4 月 30 日下午 5 点 55 分关闭。24 小时内有超过 8000 人报名，已有用户晒出了收到的邀请邮件。没被选上的人也收到了一封邮件，OpenAI 给他们的 Codex 调用额度提升了 10 倍。

奥特曼还回应了用户的调侃：马斯克如果想来也可以来，世界需要更多爱。话是这么说，可惜马斯克现在的爱全在状告 OpenAI 的起诉书里，庆祝 GPT-5.5 的香槟只能留给奥特曼自己喝了。

附上 OpenAI 博客地址🔗：

https://openai.com/index/gpt-5-5-instant/