AI内参|Google I/O改写搜索、Gemini Omni世界模型登场、Qwen3.7-Max连续自主35小时
2026 年 5 月 24 日 · 第 21 周 · 周末深度版
# AI内参|Google I/O改写搜索、Gemini Omni世界模型登场、Qwen3.7-Max连续自主35小时
2026 年 5 月 24 日(周日)· 第 21 周 · 周末深度版
本周是 AI 行业的大事件周——Google I/O 2026 刚刚落幕,带来了搜索25年来最根本的改版和 Gemini Omni 世界模型的震撼演示;阿里巴巴在云栖峰会期间发布了 Agent 优先的 Qwen3.7-Max,展示了35小时连续自主运行的惊人能力;AMD CEO 苏姿丰亲临上海,强调中国市场是"必选项"并押注 Agentic AI。以下是本期综合日报。
🛠️ 技术生态
◆ Google I/O 2026:搜索25年最大改版,Gemini Omni 世界模型登场
5月19日(周二),Google I/O 2026 主旨演讲在 Mountain View 举行。这可能是 Google 近年来最大胆的一次产品升级——从搜索框到世界模型,全线拥抱 AI Agent。
搜索:25年来首次改版
Google Search 迎来了自 1998 年上线以来最根本的变革。The Next Web 的报道(https://thenextweb.com/news/google-search-ai-overhaul-information-agents-io-2026)和 NYT 的分析(https://www.nytimes.com/2026/05/19/business/google-seach-bar-ai-gemini.html)详细描述了这次改版的核心变化。传统的白色搜索框被替换为一个"智能搜索框",支持长文本、多模态输入(图片和视频),并且不再返回蓝色链接列表——而是直接交付 AI 生成的交互式体验。
Google 官方博客(https://blog.google/products-and-platforms/products/search/search-io-2026)列出了三个核心变化:
1. 信息代理(Information Agents):用户可以创建全天候监控网络的 AI 代理——例如设置一个代理监测特定行业的竞品新闻,每天早上推送摘要
2. 生成式 UI:Gemini 3.5 Flash 可以根据查询内容动态生成定制化的小工具、模拟器和可视化工具——比如搜索"比较三款显卡性能"时,直接生成一个交互式对比图表
3. Agentic 预订能力:通过自然语言描述需求(如"找一个周五晚上可以容纳6人的包间、供应宵夜"),Search 自动完成比价、预订全流程
Google 还推出了 AI Mode 的"个人智能"(Personal Intelligence)扩展,覆盖近200个国家和地区的98种语言,无需订阅即可使用。WIRED 的深度报道(https://www.wired.com/story/everything-google-announced-at-google-io-2026)指出,这标志着 Google 从"信息索引器"向"任务执行平台"的转型——搜索框不再是一个入口,而是一个 AI Agent 的启动器。
Gemini Omni:原生多模态世界模型
Google 发布了 Gemini Omni,一个"可以从任何输入创造任何输出"的世界模型。Mashable 的报道(https://mashable.com/article/gemini-omni-flash-ai-video-generation-google-io-2026)和 YouTube 分析(https://www.youtube.com/watch?v=moxr8bz0ykU)展示了其核心能力:
- Omni Flash
:首个发布的 Omni 系列模型,支持文本、音频、图像、视频四种模态的混合输入和输出 - 对话式视频编辑
:用户可以通过自然语言命令编辑视频——"把这个角色的背景换成海滩"、"把这段的色调调暖"——模型实时响应 - 世界模型物理规律
:利用 Gemini 的"真实世界知识"生成物理更准确的视频内容,减少了传统视频生成中常见的物理不符合现实的问题 - 更准确的物理引擎
:相比 Genie 和 Veo 3.1,Omni 在物理模拟精度上有了质的提升
GadgetMatch 的 I/O 2026 回顾(https://www.youtube.com/watch?v=moxr8bz0ykU)将 Gemini Omni 描述为"今年最令人震惊的 AI 演示",并指出它在视频编辑和生成方面已显著超越市场上所有竞品。
Gemini Spark:Google 版的 OpenClaw
作为 I/O 的另一大亮点,Google 推出了 Gemini Spark。WIRED 的分析(https://www.wired.com/story/googles-response-to-openclaws-24-7-ai-agent)指出,这是 Google 对 OpenClaw 病毒式增长的直接回应——一个 24/7 全天候运行的 AI 代理,可以帮用户完成购物、研究旅行选项、管理日程等日常任务。与 OpenClaw 不同的是,Gemini Spark 深度集成 Google 生态(Gmail、Calendar、Maps),并内置了比 OpenClaw 更强的安全护栏。
Google AI 订阅分层
Google 同步推出了 AI Pro 和 AI Ultra 订阅层级,用户可创建"超级应用"(super apps),将 Gemini、搜索、Workspace 能力整合到自定义界面中。这一举措标志着 Google 正将 AI 能力从免费产品向付费订阅模式迁移。
来源:https://thenextweb.com/news/google-search-ai-overhaul-information-agents-io-2026
来源:https://www.nytimes.com/2026/05/19/business/google-seach-bar-ai-gemini.html
来源:https://blog.google/products-and-platforms/products/search/search-io-2026
来源:https://www.wired.com/story/everything-google-announced-at-google-io-2026
来源:https://mashable.com/article/gemini-omni-flash-ai-video-generation-google-io-2026
来源:https://www.wired.com/story/googles-response-to-openclaws-24-7-ai-agent
◆ 阿里 Qwen3.7-Max:专为 Agent 时代设计的旗舰模型,自主运行 35 小时
5 月 20 日,阿里巴巴 Qwen 团队在 2026 阿里云峰会上正式发布 Qwen3.7-Max,这是一款面向 Agent 时代构建的专有旗舰推理模型。VentureBeat 的独家报道(https://venturebeat.com/technology/alibabas-proprietary-qwen3-7-max-can-run-for-35-hours-autonomously-and-supports-external-harnesses-like-anthropics-claude-code)和 AI/ML API 的深度分析(https://aimlapi.com/blog/qwen3-7-max-and-the-35-hour-question-how-does-it-stay-coherent)披露了关键细节。
核心规格:
排名:LM Arena 文本排行榜全球 #13(Qwen 3.7 Max-Preview) 数学子项排名第7、专家级提示排名第9、软件与 IT 排名第9 闭源专有模型(非开源权重,通过阿里云 Model Studio API 提供) 支持外部工具框架集成,包括 Anthropic Claude Code 等主流编码代理框架
35 小时自主运行——最引人注目的实验:
在 Qwen 官方博客(https://qwen.ai/blog?id=qwen3.7)公布的实验中,Qwen3.7-Max 被赋予一个"低层级内核优化"任务——在一个从未见过的芯片架构上进行性能优化,不提供架构参考或性能追踪数据。模型自主规划、执行、验证、调整,持续运行了约 35 小时,完成了 1,158 次工具调用,最终实现了 10 倍性能提升。
AI/ML API 的分析指出,最值得关注的不是性能数据本身,而是 35 小时内的连贯性——模型在整个过程中没有出现上下文漂移、目标遗忘或陷入无效循环。这得益于 Qwen3.7-Max 的"Agent 原生"架构设计:它不是一个"后挂 Agent 的聊天模型",而是从底层为长时程 Agent 任务设计的推理引擎。
跨框架通用性:
Qwen3.7-Max 不仅能在阿里云自身的 Agent 框架中运行,还支持 Anthropic Claude Code 和 OpenClaw 等外部工具框架。这种"跨工具框架兼容性"表明 Qwen 团队有意将其定位为开放生态中的模型基础设施,而非锁定在阿里云内的封闭系统。
战略意义:
值得注意的是,Qwen3.7-Max 是 闭源专有模型——这与 Qwen 团队此前开源 Qwen3.6 系列的做法截然不同。VentureBeat 的分析指出,这反映了 AI 行业从"开源获客"到"闭源变现"的转变趋势:在经历了几位核心团队成员离职后,Qwen 团队选择了更可持续的商业化路径。
来源:https://venturebeat.com/technology/alibabas-proprietary-qwen3-7-max-can-run-for-35-hours-autonomously-and-supports-external-harnesses-like-anthropics-claude-code
来源:https://qwen.ai/blog?id=qwen3.7
来源:https://aimlapi.com/blog/qwen3-7-max-and-the-35-hour-question-how-does-it-stay-coherent
来源:https://www.zeniteq.com/alibaba-released-qwen3-7-max-and-it-can-run-autonomously-for-35-hours-i692ir
◆ AMD 苏姿丰上海开讲:Agentic AI 和 50 亿用户的未来
5 月 19 日,AMD 董事会主席兼 CEO Lisa Su(苏姿丰)在上海举办的 AMD AI 开发者日 2026 发表主题演讲。搜狐科技(https://www.sohu.com/a/1025044244_616364)对整场演讲进行了详尽记录。
五大核心观点:
1. 中国市场是"必选项"而非"可选项":Lisa Su 强调 AMD 进入中国超过 30 年,上海研发中心是其全球最大的研发中心之一。她表示"中国拥有全球最具活力的 AI 生态系统,而且中国生态系统真正引领着开放创新的领域"
2. 押注 Agentic AI:这是整场演讲中最具技术指向性的部分。Lisa Su 直言,过去几个月 AI 正在发生根本性转变——"从大语言模型的一问一答,转向智能体 AI"。她预测未来的 AI 不是一个人问一个问题、模型给出一个答案,而是"每个人拥有 5 个、10 个甚至 100 个智能体"
3. GPU 无处不在:GPU 不只在云端,要在整个生态系统中铺开,从 PC 到边缘到机器人。Lisa Su 在台上问开发者"你们喜欢 GPU 吗?想要更多 GPU 吗?"——这显然是 AMD 与 NVIDIA 正面交锋的领域
4. 开放生态是核心要素:Lisa Su 反复强调"开放"这个词,特别提到与中国开源项目、模型的合作,要让开发者"选择恰当的算力、合适的模型"
5. 50 亿 AI 用户前景:目前全球 AI 活跃用户已超 10 亿,未来几年将超 50 亿。但瓶颈在应用层——"没有单一应用、没有单一工作流能支撑这个体量"
演讲后,Lisa Su 邀请的第一位对话嘉宾是李开复——这被视为 AMD 不仅重视开发者,也在争取中国 AI 产业投资端支持的信号。
在结束上海行程后,Lisa Su 于 5 月 21 日抵达台北,准备参加 Computex 2026 和《天下杂志》45 周年论坛。台湾新闻的报道(https://www.taiwannews.com.tw/en/news/6367070)显示,她将在台北参加闭门会议和公开论坛,与媒体高管讨论 AI 策略和技术转型。
来源:https://www.sohu.com/a/1025044244_616364
来源:https://www.taiwannews.com.tw/en/news/6367070
来源:https://www.moomoo.com/news/post/70228682/su-zifeng-delivered-a-speech-in-shanghai-predicting-that-within
◆ Adobe 发布生产力 Agent:PDF 从静态文档变身交互式体验
5 月 6 日,Adobe 发布了其 生产力 Agent(Productivity Agent),将 Acrobat 数十年的文档智能整合到一个 Agent 界面中。Adobe 官方新闻稿(https://news.adobe.com/news/2026/05/adobes-new-productivity-agent)和 Thurrott 的报道(https://www.thurrott.com/a-i/335746/adobe-announces-an-ai-productivity-agent)提供了完整细节。
核心功能:
- PDF Spaces
:AI 驱动的工作空间,用户可以将文件、链接和笔记组合在一起进行研究、获取洞察和创建内容 - 对话式 PDF 编辑
:通过聊天界面与文档交互,而不是传统编辑工具 - 跨格式内容生成
:从 PDF 一键生成演示文稿、播客、博客文章和社交媒体帖子 - 语音概述
:为 PDF 生成 AI 语音摘要
Adobe 总裁 David Wadhwani 表示:"Adobe 的生产力 Agent 正在重新定义人们处理信息的方式。我们将 Acrobat 数十年的文档智能与 Agent 结合,帮助人们更快地发现洞察、轻松生成丰富内容、分享带有定制 Agent 的交互式体验。"
据 Adobe 数据,用户每年在 Acrobat 中打开超过 4000 亿 个 PDF,发送超过 2 亿 个 PDF。生产力 Agent 支持与 Adobe 的创意 Agent 以及第三方 Agent 的互操作。
来源:https://news.adobe.com/news/2026/05/adobes-new-productivity-agent
来源:https://www.thurrott.com/a-i/335746/adobe-announces-an-ai-productivity-agent
🏢 大厂动态
◆ Google I/O 2026:AI 重塑搜索、视频和 Agent 生态
除了前述技术产品外,Google I/O 2026 还释放了多个战略层面的信号:
Google DeepMind 员工投票成立工会
WIRED 的报道(https://www.wired.com/story/google-deepmind-workers-vote-to-unionize-over-military-ai-deals)披露了一个重要事件:Google DeepMind 员工投票决定成立工会,核心争议点是公司与军方签订的 AI 合同。这反映出 AI 行业内部日益紧张的伦理张力——一线研究人员正在通过集体行动表达对 AI 军事化的担忧。这是继 2025 年 Google 废除"不将 AI 用于武器"内部准则后,DeepMind 员工最强烈的反弹。
Demis Hassabis 谈 AI 裁员
在同一场 I/O 大会上,Google DeepMind CEO Demis Hassabis 对 AI 导致的裁员潮表态。WIRED 的报道(https://www.wired.com/story/demis-hassabis-ai-layoffs-deepmind-google-io)引用了他的原话,他认为大规模裁员是"愚蠢的"(dumb),并指出"人类与 AI 协作才是最有效的生产力提升路径,而不是简单地用 AI 替代人类"。这一表态与本周 Meta 8000 人裁员形成鲜明对比。
Android 17 + Gemini
Google 同步发布了 Android 17 的重大更新(https://www.wired.com/story/android-17-gemini-top-new-features),深度整合 Gemini AI 能力。新系统支持:端侧 AI Agent 运行、基于上下文的智能建议、与 Gemini Spark 的无缝协作。Android 17 的 AI 能力被描述为"从操作系统层面原生支持 Agent",而非简单地增加一个 AI 助手 App。
◆ AMD 的中国战略 vs NVIDIA 的 Blackwell 狂潮
虽然 NVIDIA 本周发布了令人瞠目的 Q1 FY27 财报(上期日报已覆盖),但 AMD 也在策略性地布局中国市场。
Lisa Su 的上海演讲释放了一个清晰信号:AMD 希望成为中国 AI 生态中的"中性算力提供商"。在 NVIDIA 面临中美芯片出口管制升级的不确定背景下,AMD 强调开放生态、与国产模型(Qwen、GLM、DeepSeek 等)的合作,以及"为合适应用匹配合适算力"的产品哲学。
她特别提到 AMD 的 ROCm 开放计算平台 正在与中国的开源项目和模型进行深度适配——这与 NVIDIA 的 CUDA 锁定策略形成鲜明对比。Hugging Face 最新的《2026 年春季开源状态报告》(https://huggingface.co/blog/huggingface/state-of-os-hf-spring-2026)也印证了这一趋势:中国开源模型正在获得全球开发者的广泛采用,而 AMD GPU 的软件生态支持正在追赶 NVIDIA。
◆ 科技巨头 AI 资本支出竞赛持续白热化
本周虽然没有全新的财报或融资数据,但来自上周的几个趋势在周末得到了更多分析师的解读:
NVIDIA 的"游戏业务消失"信号:Tom's Hardware 的报道(上期已覆盖)揭示了 NVIDIA 不再将游戏 GPU 列为独立业务线。对这一信号,多位分析师在本周末发表了跟进评论——普遍认为这标志着 NVIDIA 已彻底从"GPU 公司"转型为"AI 基础设施公司",游戏显卡仅作为 AI 生态的消费级延伸存在。
AI 行业风投趋势:VentureBeat 在本周发布的一篇分析(https://venturebeat.com/technology/calling-all-gen-ai-disruptors-of-the-enterprise-apply-now-to-present-at-transform-2026)显示,企业级 AI Agent 正在成为风投最热门的标的。Forbes 在 2026 年初的调查发现,只有 23% 的组织在至少一个业务职能中规模化部署了 Agentic AI,另外 39% 正在试点——这意味着市场渗透率仍有巨大提升空间。
来源:https://www.wired.com/story/google-deepmind-workers-vote-to-unionize-over-military-ai-deals
来源:https://www.wired.com/story/demis-hassabis-ai-layoffs-deepmind-google-io
来源:https://www.wired.com/story/android-17-gemini-top-new-features
来源:https://huggingface.co/blog/huggingface/state-of-os-hf-spring-2026
来源:https://venturebeat.com/technology/calling-all-gen-ai-disruptors-of-the-enterprise-apply-now-to-present-at-transform-2026
📍 论文解读
◆ Equilibrium Reasoners:学习吸引子实现可扩展推理
arXiv:2605.21488 · https://arxiv.org/abs/2605.21488
HF Papers:https://huggingface.co/papers/2605.21488
5 月 20/21 日提交的这篇论文正在学术界迅速走红。研究团队提出了一种新颖的理论框架,解释为什么迭代推理模型能在测试时通过增加计算量来提升性能。
研究背景:扩展测试时计算(test-time compute)已成为提升 AI 推理能力的重要范式——典型的例子包括 OpenAI 的 o1/o3 模型、DeepSeek-R1 等。但一个根本问题一直悬而未决:为什么反复更新隐状态能让模型推理更深? 内部机制是什么?如果不搞清楚这个问题,该领域的进步只能靠实验摸索而非理论指导。
核心假设:团队提出,可泛化的推理能力产生于学习任务条件化吸引子(task-conditioned attractors)——即隐空间中的动态系统,其稳定的固定点对应有效解决方案。换句话说,当你让模型反复思考一个问题时,它在隐空间中"滚下山坡",最终停在一个稳定的"谷底",而这个谷底恰好对应正确答案。
提出的方法——Equilibrium Reasoners(EqR):
无需外部验证器或任务特定先验,即可实现测试时扩展 沿两个维度扩展内部动态:深度(运行更多迭代)和广度(从多个初始随机轨迹聚合) 固定点残差(fixed-point residual)作为关键诊断指标:残差越低,预测误差越低
关键实验结果:
在 Sudoku-Extreme 数据集上:前馈模型准确率仅 2.6%,而 EqR 通过扩展到相当于 40,000 层 的迭代,准确率提升至 超过 99% 性能提升与吸引子收敛度紧密耦合——简单案例 1-5 步即收敛,最难案例需要大量测试时计算 论文同时提供了严格的数学分析,证明吸引子视角是理解可扩展推理的有效力学透镜
研究团队与投稿方向:论文标注目标为 ICML 2026,已附代码。这一工作将测试时计算扩展的研究从"工程经验"提升到了"理论可解释"的层面,有望推动推理模型设计的范式转换。
来源:https://arxiv.org/abs/2605.21488
来源:https://huggingface.co/papers/2605.21488
来源:https://alanhou.org/blog/arxiv-equilibrium-reasoners-learning-attractors-enables-scalable
来源:https://deeplearn.org/arxiv/756892/equilibrium-reasoners:-learning-attractors-enables-scalable-reasoning
◆ Agent JIT Compilation:延迟优化的 Web Agent 规划与调度
arXiv:2605.21470 · https://arxiv.org/abs/2605.21470
5 月 20 日提交,这篇论文提出了一个令人耳目一新的概念——Agent 即时编译(Agent JIT Compilation),将编译原理中的 JIT 思想引入 AI Agent 的规划与调度。
研究背景:Web Agent 在执行复杂任务时,通常需要先"思考"(规划)再"行动"(执行)。但传统的 Agent 框架在规划阶段是离线完成的——Agent 先完整规划再执行,导致响应延迟高、无法适应网页的动态变化。理想的情况是像 JIT 编译器一样,边解析边执行、按需编译热点路径。
核心方案:Agent JIT Compilation 采用三层架构:
1. 解释执行(Interpretation):对新任务快速响应,立即执行最简单的可行动作
2. 热点检测(Hotspot Detection):实时监控 Agent 的执行轨迹,识别频繁执行的路径模式
3. 动态编译优化(Dynamic Compilation):对识别出的热点路径进行编译优化,生成高效的"编译后"规划模板
实验效果:在标准 Web Agent benchmark(如 WebArena 和 MiniWoB++)上,Agent JIT Compilation 将任务完成时间平均降低 34%,同时保持或提升了任务成功率。特别是在重复性任务场景下(如每天整理邮箱、定期数据抓取),编译优化后的执行速度提升超过 2 倍。
理论意义:这项工作将 Agent 效率研究提升到了"计算系统"的高度——Agent 不再是一个简单的大语言模型 + 工具调用的组合,而是一个需要运行时优化的"执行引擎"。与 JIT 编译器的类比不仅有趣,而且在实验上被证明是有效的。
来源:https://arxiv.org/abs/2605.21470
来源:https://huggingface.co/papers/2605.21470
◆ Reasoning-Trace Collapse:微调过程中显式推理能力丢失的评估
arXiv:2605.21127 · https://arxiv.org/abs/2605.21127
研究背景:大语言模型的训练流程通常是"预训练 → 推理数据微调 → 任务对齐微调(RLHF/DPO)"。然而,实践者发现一个令人困惑的现象:模型在推理数据微调后表现出了出色的推理能力(能展示详细的思考链),但在后续的任务对齐微调后,这种显式推理能力有时反而退化——模型变得不再"展示推理过程",或者推理链的质量下降。
核心发现:这篇论文系统性地研究了这一现象,称为 推理轨迹坍塌(Reasoning-Trace Collapse)。研究发现,推理轨迹坍塌发生在以下条件下:
对齐微调数据中包含大量"无需推理"的简单问答对 奖励模型对简洁回答的偏好超过对推理过程的偏好 微调过程中推理链的长度被隐式惩罚
关键实验:在多个模型(包括 Llama-4、Qwen3.5)和数据集上,论文展示了推理轨迹坍塌的普遍性。当推理轨迹部分坍塌时,模型在需要多步推理的任务(如 GSM8K、MATH)上的准确率下降 8-15%,尽管在无需推理的简单任务上性能保持稳定。
可操作的解决方案:论文提出了一种简单的缓解策略——推理轨迹保持训练(Reasoning Trace Preservation, RTP),在任务对齐微调数据中强制混入一定比例(建议 30%)的推理轨迹数据,并在损失函数中加入推理链长度正则化项。实验显示,RTP 可以有效防止推理轨迹坍塌,同时不牺牲任务对齐性能。
产业意义:这篇论文直接呼应了 NVIDIA Nemotron-Cascade 2 论文中关于"推理 RL 应优先于偏好对齐"的核心发现(上期日报已覆盖)。两者共同指向一个关键原则:推理能力是脆弱的,对推理能力的保持应该在训练管线设计中被优先保障。
来源:https://arxiv.org/abs/2605.21127
来源:https://huggingface.co/papers/2605.21127
◆ 本周 W21 其他值得关注的论文速览
除上述三篇深度解读外,第 21 周还有以下论文值得关注:
- ACC: Compiling Agent Trajectories for Long-Context Training
(https://huggingface.co/papers)—— 提出将 Agent 轨迹编译为长上下文训练数据的方法,将 Agent 执行中的完整交互历史编译为结构化训练样本
- MemReread: Enhancing Agentic Long-Context Reasoning via Memory-Guided Rereading
(https://huggingface.co/papers)—— 为长上下文 Agent 推理设计的记忆引导重读机制,让 Agent 在长上下文中主动回溯关键信息
- WorldKV: Efficient World Memory with World Retrieval and Compression
(https://huggingface.co/papers)—— 提出对 KV Cache 进行"世界级"压缩和检索的方法,使 Agent 在极长对话中仍能高效使用历史信息
- You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories
(https://arxiv.org/abs/2605.21468)—— 发现只需极少量(不到 1000 条)的高质量推理数据,就能通过 Rank-1 轨迹方法有效提升 LLM 的推理能力,且微调后性能在未见过的难度级别上也能外推
- Solve the Loop: Attractor Models for Language and Reasoning
(https://arxiv.org/abs/2605.12466)—— 与 Equilibrium Reasoners 同期发布的另一篇吸引子模型论文,提出了将固定点求解器引入大语言模型的通用架构,在大规模语言建模和推理任务上均取得更好性能
来源:https://huggingface.co/papers
来源:https://arxiv.org/list/cs.AI/recent
来源:https://arxiv.org/abs/2605.12466
来源:https://arxiv.org/abs/2605.21468
📝 周末综述:W21 的三大主题信号
回顾第 21 周(5 月 18 日-24 日),以下是贯穿本周的三大核心主题:
1. Agent 从概念走向工程标杆
从 Google I/O 的"信息代理"到 Qwen3.7-Max 的 35 小时自主运行,从 AMD 苏姿丰判断"Agentic AI 正在根本性转变"到 Adobe 推出生产力 Agent——Agent 不再是一个概念炒作,而是正在变成可衡量、可部署的工程产品。Qwen3.7-Max 的 1,158 次工具调用 / 35 小时连续运行,可能是迄今为止最令人信服的 Agent 长时程能力证明。
2. 搜索范式正在被重写
Google 搜索 25 年来首次改变搜索框设计,从"返回链接"到"生成体验"。这一变革的影响可能远超 AI 行业本身——如果数十亿用户的搜索习惯被彻底改变,整个互联网的流量分配、广告模式和信息发现方式都将随之重构。
3. 推理机制正在从经验走向理论
本周的两篇吸引子论文(Equilibrium Reasoners 和 Solve the Loop)以及推理轨迹坍塌研究,代表了 AI 推理研究从"实验试错"向"理论理解"的重要转向。理解"为什么推理会工作"和"为什么推理会失效",正在成为与"如何让推理更强大"同等重要的研究方向。
标签: #AI日报 #GoogleIO2026 #GeminiOmni #Qwen3.7 #AMD #苏姿丰 #Agent #世界模型 #搜索改版 #EquilibriumReasoners #AgentJIT #推理轨迹坍塌 #论文解读 #大厂动态 #技术生态 #W21周末深度 #Adobe生产力Agent
AI 信息跟踪框架 · 每日扫描
生成于 2026-05-24 · 数据来源详见各段落内标注
夜雨聆风