AI情报助手日报04-26-夜雨聆风

AI情报助手日报04-26

ICLR 2026 论文速递

AI大模型在多轮对话中表现下降。
ICLR 2026优秀论文揭示，AI大模型在多轮对话中能力和可靠性显著下降，平均性能下降39%，与单轮对话表现形成鲜明对比，引发对大模型实际应用场景的深思。
多语言能力“外挂式”加载。
中科院计算所团队提出XBridge范式，通过组合LLM与NMT模型，无需训练LLM即可显著提升其低资源甚至未见语言的理解和生成能力，并缩小高低资源语言间的性能差距。
文生图模型方法论升级。
清华大学段岳圻团队提出CFG-Ctrl，将扩散模型引导机制转化为可控动态系统，通过引入控制理论，解决了文生图模型在可控性和稳定性之间的冲突，提升了生成质量与语义对齐。
LLM DNA揭示模型隐藏血缘。
新加坡国立大学与上海交通大学团队提出LLM DNA，通过功能行为表征揭示大模型间的隐藏血缘，无需训练即可构建模型系统发育树，已被ICLR’26接收为Oral。

AI 算力与系统

CPU在AI系统中作用被重新评估。
AI算力逻辑正从单纯扩张GPU转向提升系统编排效率，CPU在AI系统中的作用被重新评估并回到核心位置，英特尔、海光信息等CPU厂商因此受到市场关注。
谷歌发布弹性大规模分布式预训练技术。
谷歌发布Decoupled DiLoCo分布式训练技术，利用全球异构硬件，即使硬件故障系统也不停止运行，有望使弹性大规模AI预训练成为切实可行的工程实践。
十亿级通用原子势训练进入Exascale时代。
中国科学院计算技术研究所团队提出十亿级通用原子势模型MatRIS-MoE及分布式训练框架Janus，在Exascale超算上实现1.2EFLOPS峰值性能，将训练时间从数周缩短至数小时。

AI 智能体进展

AI生成足球战术轨迹。
香港中文大学（深圳）等团队提出TacticGen，利用AI生成足球战术轨迹，能根据战术目标生成可供比较的跑位方案，将AI从“理解比赛”推向“参与战术设计”。
多模态癌症生存预测系统SurvAgent。
研究团队推出SurvAgent，一个多智能体系统，通过分层思维链增强案例库和二分法推理，实现多模态癌症生存预测，融合病理图像与基因组数据，提升预测透明度和准确性。
MiniMax CLI实现“一句话到成片”。
MiniMax CLI通过Agent设计，实现“一句话到成片”的高度自动化流程，引入SKILL.md说明书，将人类操作中的隐性工作转化为Agent可理解的规则，极大提升了Agent的工具使用能力。
AI代码Agent失败根源可精准定位。
南京大学与快手科技合作提出CodeTracer框架，无需重训即可精准定位AI代码Agent失败根源，通过将Agent运行状态转化为层级状态树，自动定位错误节点并反馈诊断信息，实现错误恢复。
多模型协同进化突破单模型天花板。
研究团队提出Squeeze Evolve多模型进化框架，通过编排不同模型，无需外部验证器即可突破单一模型能力天花板，实现更强推理，在多个领域超越单模型基线。

AI 行业动态

Anthropic产品开发提速。
Anthropic产品负责人Kat Wu分享公司产品开发秘密，其发版周期从6个月缩短至1天，通过清晰目标、Research Preview机制和Launch Room流程，实现快速迭代。
谷歌投资Anthropic改变AI格局。
谷歌宣布向AI公司Anthropic投资最高400亿美元，并承诺未来五年提供5GW的TPU算力。此举改变了AI“御三家”格局，使OpenAI面临被孤立的风险。
Anthropic源码泄露揭示Claude野心。
Anthropic因npm包配置失误，意外泄露51万行Claude源码，揭示其代号“Conway”的惊人野心。Claude正从聊天机器人转变为24小时常驻后台、持续运行的智能体，目标成为下一代操作系统入口。
OpenAI发布GPT-5.5提示词指南。
OpenAI发布GPT-5.5提示词指南，建议在多步骤任务中，工具调用前发送简短的用户可见更新，并强调GPT-5.5应被视为新模型家族，需重新调整提示词。
OpenAI高管确认Codex整合进GPT-5.4。
OpenAI高管Romain Huet确认，GPT-5.4已将Codex整合进主模型，不再有独立的编码线。GPT-5.5进一步提升了代理式编码和计算机使用能力。
OpenAI发布GPT-5.5模型。
llm 0.31版本发布，新增支持OpenAI的GPT-5.5模型。该版本还引入了文本详细度、图像细节设置选项，并优化了异步模型注册功能。
OpenAI面临危机。
OpenAI近期发布GPT-5.5，奥特曼推行大规模“清洗”，砍掉Sora、科学部等项目，聚焦企业市场。面对Anthropic营收反超和内部高层动荡，OpenAI正孤注一掷寻求IPO。
腾讯AI混元团队经历变革。
腾讯AI Lab因组织架构调整和核心人才流失而撤销，混元大模型团队经历多次变革。原AI Lab三剑客相继离职，标志着腾讯AI从实验室时代转向大模型工程化落地。
多邻国调整“AI-First”策略。
多邻国从“AI-First”策略回摆，不再强制员工使用AI并将其纳入绩效考核。过度依赖AI导致课程质量下降、用户流失与股价下跌，公司正重新聚焦用户增长和教学效果。

AI 应用与落地

涂鸦智能发布AI生活助手Hey Tuya。
涂鸦智能发布AI生活助手Hey Tuya，强调AI从“听令行事”到“主动服务”。涂鸦智能联席董事长兼总裁陈燎罕认为，绝大部分硬件都值得用AI重做一遍。
创业者探索AI成本优化方案。
海淀区创业者正积极探索AI成本优化方案，通过端侧部署、多智能体协同及太空算力等多种技术路径，旨在降低AI使用成本，让AI成为更普惠的基础设施。
工业智能体公司智用开物获近亿投资。
工业智能体公司智用开物完成近亿元天使+轮融资，由瑞枫资本领投。公司核心团队来自微软，致力于通过“工业语义引擎+多智能体系统”解决工业AI落地难题。
英特尔携手奇瑞汽车、均联智行。
英特尔携手奇瑞汽车、均联智行，推出基于酷睿Ultra平台的AI Box Ultra解决方案。该方案赋能汽车座舱，打造AI智能体随行新时代，提供智能娱乐与多模态交互体验。
AI音乐沦为“虚假繁荣”。
AI音乐模型快速发展，但版权方严防死守，平台激进布局。Deezer报告显示，AI歌曲日增7.5万首，播放占比仅1%-3%，沦为“虚假繁荣”，引发多方博弈。
AI图像生成模型意外行为。
文章探讨了AI图像生成模型ChatGPT Images 2.0的意外行为。作者发现，模型在生成图像时自主添加了“WHY ARE YOU LIKE THIS”的标语，引发了对AI创造力的思考。
AI在投资骗局中表现更清醒。
一项研究显示，面对年化40%的投资骗局，七款主流大模型在防骗实测中表现出比人类顾问更强的抗压能力，对欺诈投资的认可率为0%。
Anthropic实验揭示AI智能体能力差距。
Anthropic“Project Deal”实验显示，强模型智能体在交易中比弱模型多赚70%，但用户对弱模型的表现仍满意。实验揭示了AI智能体能力差距带来的隐秘鸿沟。

其他

华为Pura X Max折叠屏手机。
华为Pura X Max以“阔型”比例颠覆传统折叠屏，内外屏近似√2:1，旨在解决内屏浪费、外屏鸡肋的痛点，配合HarmonyOS和伴随式AI，实现手机、平板的无缝融合。
上海交大教授开源Path2AGI项目。
上海交通大学金耀辉教授开源Path2AGI项目，旨在回答AI时代是否仍需学习基础学科的问题。该项目汇集25个基础学科，提供5条能力路径，帮助学习者理解AI的深层原理。
极客早知道。
本期极客早知道汇总多条科技动态：英特尔股价大涨，豆包上线“帮你选”功能，泡泡玛特推出冰箱，高铁试点带自行车；英伟达市值再破5万亿，DeepSeek-V4发布，谷歌投资Anthropic，微软推员工买断计划。
阅读清单。
本期阅读清单涵盖机器人、制造业、地缘政治等多个领域。Ultra Robotics发布了人形机器人OP1，可安装在大型机械臂上，同时探讨了变压器钢制造、加州住房政策及海湾地区冲突影响。
成都发票抽奖活动。
成都推出发票抽奖活动，个人消费者在零售、餐饮、住宿、文旅等五大行业消费满100元，获取抬头为本人姓名的数电发票即可参与抽奖。