AI日报#21:GPT-5.6曝下月发布,上下文窗口提升至150万tokens

每日精选AI圈最值得关注的动态

GPT-5.6曝光、苹果押注1.2T参数定制模型改造Siri、DeepSeek永久降价75%——六月将成为AI模型密集发布的"超级月"。

🚀 OpenAI GPT-5.6 模型曝下月发布，上下文窗口达150万tokens[1]

来源：IT之家

多名开发者在OpenAI Codex后端日志中发现了未官宣的GPT-5.6模型，内部代号iris-alpha。该模型支持150万token的上下文窗口，较当前GPT-5.5的105万token提升约43%，测试显示输入达90万token时仍能流畅响应。同系列还发现了ember-alpha与beacon-alpha版本。据爆料，Anthropic Claude、Google Gemini及xAI Grok也可能瞄准同期发布新模型，六月将成为AI模型密集发布的"超级月"。

🍎 苹果据称正使用定制版1.2T参数Google模型重塑下一代Siri[2]

来源：X @kimmonismus

据报道，苹果为改造下一代Siri，正在使用一个定制版、参数规模达1.2T的Google大模型作为核心，显著大于预估约300B参数的Gemini 3.5 Flash。简单查询预期在本地设备运行，关键挑战是确保大模型能足够快速地响应日常问题。下个月WWDC上将展示Apple Intelligence与Gemini整合，同时还有GPT-5.6、可能的Sonnet 4.8/Opus 4.8等重磅发布。

💰 DeepSeek将对其旗舰AI模型实施永久性75%折扣[3]

来源：Bloomberg / Hacker News

DeepSeek宣布对其旗舰AI模型实施永久性75%折扣，这一激进的定价策略将进一步加剧AI模型市场的价格竞争。作为以低成本高性能著称的中国AI公司，DeepSeek此举可能对整个行业定价体系产生深远影响。

技巧与观点

🎤 Anthropic联合创始人Chris Olah在教皇通谕发布会上的讲话[4]

来源：Anthropic Newsroom

Anthropic联合创始人Chris Olah在梵蒂冈出席教皇Leo XIV关于AI的通谕发布会。他指出所有前沿AI实验室都面临商业、研究及地缘政治等多重压力，外部监督至关重要。他强调AI模型并非像飞机那样被工程化构建，而是基于人类语言和思想"生长"出来的，其内在性质可能复杂难解。他提出三个核心问题：如何确保AI发展的全球收益公平分享、如何思考AI时代的人类繁荣，以及AI模型内在性质的本质。

🔧 Harness、Scaffold 与 AI 智能体术语辨析[5]

来源：Hugging Face Blog

文章厘清了AI智能体领域的关键术语：模型（Claude、GPT）本身是无记忆、无循环的大语言模型；"Scaffolding"（行为定义层）通过系统提示和工具描述塑造模型行为；"Harness"（执行层）负责调用模型、处理工具调用与控制循环。文章提出了 Agent = Model + Harness 的理解框架，并以Claude Code、Codex为例说明同一模型搭配不同Harness会产生截然不同的体验。

⚡ Claude Code自动模式：多任务并行的关键技巧[6]

来源：X @bcherny

Anthropic工程师Boris Cherny分享了Claude Code的最大使用技巧——自动模式。自动模式取消权限提示，是实现"多Claude并行"的关键：启动一个会话后，在其运行时可以并行处理另一个会话，大幅提升开发效率。

🤖 面向 Codex 的自我优化提示词框架[7]

来源：X @gdb (Greg Brockman)

OpenAI联合创始人Greg Brockman分享了一个结构化提示词框架，用于指导Codex自动分析历史记录并识别重复工作流。框架要求Codex回顾会话数据，找出至少出现两次、输入稳定、可提升效率的任务，最终以"技能"或子智能体等形式创建可复用资产。

📖 格雷格·布罗克曼回忆差点让OpenAI覆灭的72小时[8]

来源：Farnam Street / Hacker News

OpenAI联合创始人Greg Brockman在播客中回顾了2023年底那段惊心动魄的72小时——Sam Altman被解雇又复职的事件。这段经历差点让OpenAI分崩离析，也成为AI行业治理和权力结构讨论的标志性事件。

产品发布/更新

🛠️ Grok Build Beta版向SuperGrok用户开放[9]

来源：X @xai

xAI宣布Grok Build正式面向所有SuperGrok和X Premium+用户推出Beta版。用户可以使用Plan Mode规划任务，通过Imagine创建图像和视频，并通过CLI构建自动化或编排器。访问x.ai/cli即可开始使用。

⚡ Qwen3.7-Max隐式缓存功能上线[10]

来源：X @Alibaba_Qwen

通义千问团队宣布Qwen3.7-Max的隐式缓存功能正式上线，自动启用、无需额外设置，开箱即用即可获得更快更便宜的推理体验。需要更高命中率还可尝试显式缓存功能。

🎬 Luma Agents 实现规模化真实 UGC 广告生成[11]

来源：X @LumaLabsAI

Luma AI推出Agents功能，实现规模化UGC风格广告生成。用户定义简报和风格后，Luma Agents自动构建每一条UGC风格广告，将"规模化的真实性"从矛盾变为现实。

🔓 OpenClaw 2026.5.22发布：性能优化与安全加固[12]

来源：X @openclaw

OpenClaw新版本上线，Gateway/模型启动路径更精简，/models响应时间降至约5毫秒，npm包现提供锁定依赖项，Windows安装/更新路径更安全。

模型发布/更新

🔬 面壁智能联合清华开源中国首个基于华为昇腾训练的1.58-bit端侧大模型[13]

来源：IT之家

面壁智能联合清华大学等机构开源了中国首个基于华为昇腾训练的1.58-bit端侧大模型BitCPM-CANN，标志着国产AI芯片在端侧大模型训练和推理方面取得重要突破。

[1] GPT-5.6曝下月发布 https://www.ithome.com/0/955/078.htm
[2] 苹果定制1.2T参数Google模型重塑Siri https://x.com/kimmonismus/status/2058997271803674991
[3] DeepSeek旗舰模型永久75%折扣 https://www.bloomberg.com/news/articles/2026-05-23/deepseek-to-make-permanent-75-discount-on-flagship-ai-model
[4] Chris Olah教皇通谕发布会讲话 https://www.anthropic.com/news/chris-olah-pope-leo-encyclical
[5] AI智能体术语辨析 https://huggingface.co/blog/agent-glossary
[6] Claude Code自动模式技巧 https://x.com/bcherny/status/2058519809214607704
[7] Codex自我优化提示词框架 https://x.com/gdb/status/2058598608224858442
[8] Greg Brockman回忆OpenAI危机72小时 https://fs.blog/knowledge-project-podcast/greg-brockman
[9] Grok Build Beta开放 https://x.com/xai/status/2058973760708091907
[10] Qwen3.7-Max隐式缓存上线 https://x.com/Alibaba\_Qwen/status/2058932656797368619
[11] Luma Agents规模化UGC广告 https://x.com/LumaLabsAI/status/2058672731705503959
[12] OpenClaw 2026.5.22发布 https://x.com/openclaw/status/2058397616124072274
[13] 面壁智能BitCPM-CANN开源 https://www.ithome.com/0/954/759.htm