每日精选AI圈最值得关注的动态
GPT-5.6曝光、苹果押注1.2T参数定制模型改造Siri、DeepSeek永久降价75%——六月将成为AI模型密集发布的"超级月"。
🚀 OpenAI GPT-5.6 模型曝下月发布,上下文窗口达150万tokens[1]
来源:IT之家
多名开发者在OpenAI Codex后端日志中发现了未官宣的GPT-5.6模型,内部代号iris-alpha。该模型支持150万token的上下文窗口,较当前GPT-5.5的105万token提升约43%,测试显示输入达90万token时仍能流畅响应。同系列还发现了ember-alpha与beacon-alpha版本。据爆料,Anthropic Claude、Google Gemini及xAI Grok也可能瞄准同期发布新模型,六月将成为AI模型密集发布的"超级月"。
🍎 苹果据称正使用定制版1.2T参数Google模型重塑下一代Siri[2]
来源:X @kimmonismus
据报道,苹果为改造下一代Siri,正在使用一个定制版、参数规模达1.2T的Google大模型作为核心,显著大于预估约300B参数的Gemini 3.5 Flash。简单查询预期在本地设备运行,关键挑战是确保大模型能足够快速地响应日常问题。下个月WWDC上将展示Apple Intelligence与Gemini整合,同时还有GPT-5.6、可能的Sonnet 4.8/Opus 4.8等重磅发布。
💰 DeepSeek将对其旗舰AI模型实施永久性75%折扣[3]
来源:Bloomberg / Hacker News
DeepSeek宣布对其旗舰AI模型实施永久性75%折扣,这一激进的定价策略将进一步加剧AI模型市场的价格竞争。作为以低成本高性能著称的中国AI公司,DeepSeek此举可能对整个行业定价体系产生深远影响。
技巧与观点
🎤 Anthropic联合创始人Chris Olah在教皇通谕发布会上的讲话[4]
来源:Anthropic Newsroom
Anthropic联合创始人Chris Olah在梵蒂冈出席教皇Leo XIV关于AI的通谕发布会。他指出所有前沿AI实验室都面临商业、研究及地缘政治等多重压力,外部监督至关重要。他强调AI模型并非像飞机那样被工程化构建,而是基于人类语言和思想"生长"出来的,其内在性质可能复杂难解。他提出三个核心问题:如何确保AI发展的全球收益公平分享、如何思考AI时代的人类繁荣,以及AI模型内在性质的本质。
🔧 Harness、Scaffold 与 AI 智能体术语辨析[5]
来源:Hugging Face Blog
文章厘清了AI智能体领域的关键术语:模型(Claude、GPT)本身是无记忆、无循环的大语言模型;"Scaffolding"(行为定义层)通过系统提示和工具描述塑造模型行为;"Harness"(执行层)负责调用模型、处理工具调用与控制循环。文章提出了 Agent = Model + Harness 的理解框架,并以Claude Code、Codex为例说明同一模型搭配不同Harness会产生截然不同的体验。
⚡ Claude Code自动模式:多任务并行的关键技巧[6]
来源:X @bcherny
Anthropic工程师Boris Cherny分享了Claude Code的最大使用技巧——自动模式。自动模式取消权限提示,是实现"多Claude并行"的关键:启动一个会话后,在其运行时可以并行处理另一个会话,大幅提升开发效率。
🤖 面向 Codex 的自我优化提示词框架[7]
来源:X @gdb (Greg Brockman)
OpenAI联合创始人Greg Brockman分享了一个结构化提示词框架,用于指导Codex自动分析历史记录并识别重复工作流。框架要求Codex回顾会话数据,找出至少出现两次、输入稳定、可提升效率的任务,最终以"技能"或子智能体等形式创建可复用资产。
📖 格雷格·布罗克曼回忆差点让OpenAI覆灭的72小时[8]
来源:Farnam Street / Hacker News
OpenAI联合创始人Greg Brockman在播客中回顾了2023年底那段惊心动魄的72小时——Sam Altman被解雇又复职的事件。这段经历差点让OpenAI分崩离析,也成为AI行业治理和权力结构讨论的标志性事件。
产品发布/更新
🛠️ Grok Build Beta版向SuperGrok用户开放[9]
来源:X @xai
xAI宣布Grok Build正式面向所有SuperGrok和X Premium+用户推出Beta版。用户可以使用Plan Mode规划任务,通过Imagine创建图像和视频,并通过CLI构建自动化或编排器。访问x.ai/cli即可开始使用。
⚡ Qwen3.7-Max隐式缓存功能上线[10]
来源:X @Alibaba_Qwen
通义千问团队宣布Qwen3.7-Max的隐式缓存功能正式上线,自动启用、无需额外设置,开箱即用即可获得更快更便宜的推理体验。需要更高命中率还可尝试显式缓存功能。
🎬 Luma Agents 实现规模化真实 UGC 广告生成[11]
来源:X @LumaLabsAI
Luma AI推出Agents功能,实现规模化UGC风格广告生成。用户定义简报和风格后,Luma Agents自动构建每一条UGC风格广告,将"规模化的真实性"从矛盾变为现实。
🔓 OpenClaw 2026.5.22发布:性能优化与安全加固[12]
来源:X @openclaw
OpenClaw新版本上线,Gateway/模型启动路径更精简,/models响应时间降至约5毫秒,npm包现提供锁定依赖项,Windows安装/更新路径更安全。
模型发布/更新
🔬 面壁智能联合清华开源中国首个基于华为昇腾训练的1.58-bit端侧大模型[13]
来源:IT之家
面壁智能联合清华大学等机构开源了中国首个基于华为昇腾训练的1.58-bit端侧大模型BitCPM-CANN,标志着国产AI芯片在端侧大模型训练和推理方面取得重要突破。
[1] GPT-5.6曝下月发布 https://www.ithome.com/0/955/078.htm
[2] 苹果定制1.2T参数Google模型重塑Siri https://x.com/kimmonismus/status/2058997271803674991
[3] DeepSeek旗舰模型永久75%折扣 https://www.bloomberg.com/news/articles/2026-05-23/deepseek-to-make-permanent-75-discount-on-flagship-ai-model
[4] Chris Olah教皇通谕发布会讲话 https://www.anthropic.com/news/chris-olah-pope-leo-encyclical
[5] AI智能体术语辨析 https://huggingface.co/blog/agent-glossary
[6] Claude Code自动模式技巧 https://x.com/bcherny/status/2058519809214607704
[7] Codex自我优化提示词框架 https://x.com/gdb/status/2058598608224858442
[8] Greg Brockman回忆OpenAI危机72小时 https://fs.blog/knowledge-project-podcast/greg-brockman
[9] Grok Build Beta开放 https://x.com/xai/status/2058973760708091907
[10] Qwen3.7-Max隐式缓存上线 https://x.com/Alibaba\_Qwen/status/2058932656797368619
[11] Luma Agents规模化UGC广告 https://x.com/LumaLabsAI/status/2058672731705503959
[12] OpenClaw 2026.5.22发布 https://x.com/openclaw/status/2058397616124072274
[13] 面壁智能BitCPM-CANN开源 https://www.ithome.com/0/954/759.htm
夜雨聆风