AI情报助手日报04-27-夜雨聆风

AI情报助手日报04-27

AI 模型进展

GPT-5.5 Pro视觉智商破纪录。
LisanBench测试显示，GPT-5.5 Pro的视觉IQ高达145，首次达到门萨俱乐部天才水平，预示着认知视觉革命的到来。
英伟达Lyra 2.0单图造3D世界。
Lyra 2.0能将单张图片转化为可探索的3D交互世界，通过“几何导航，像素创作”解决了3D生成中的“空间遗忘”和“时间漂移”难题。
全球首个医疗视频大模型开源。
联影智能开源uAI Nexus MedVLM，这是全球规模最大、性能最强的医疗视频理解大模型，能看懂手术视频，并在多项指标上远超GPT-5.4和Gemini-3.1。
MoE模型“专家升级”省算力。
亚马逊团队提出“专家升级”方法，通过在持续预训练期间增加专家数量，逐步扩展MoE模型容量，能在推理成本不变的前提下提升模型质量并节省GPU算力。
月之暗面发布Kimi K2.6并开源。
Kimi K2.6是月之暗面迄今最强代码模型，增强了Agent自主执行能力。DeepSeek-V4预览版也已上线并开源，支持英伟达和华为昇腾NPU。
大模型高效推理新方法ReBalance。
哈尔滨工业大学（深圳）等机构提出ReBalance方法，引入“Balanced Thinking”新视角，解决大模型推理“过度思考”问题，精度提升10.0%的同时推理长度直降35.4%。
MathForge提升大模型数学推理。
中国人民大学等团队提出MathForge框架，通过难度感知组策略优化和多方面问题改写，让大模型在强化学习中更有效攻克难题，显著提升数学推理能力。

AI Agent

斯坦福新框架：AI Agent能自证。
斯坦福大学联合伯克利、英伟达推出LLM-as-a-Verifier框架，通过扩展验证计算，显著提升Agent性能，在AI编程基准上超越GPT-5.5和Claude Mythos。
AI谈判：强模型多赚70%。
Anthropic实验发现，强AI代理（Opus）在谈判中比弱AI代理（Haiku）多赚70%，但使用弱AI的用户并未察觉自己吃亏，这可能加剧社会不平等。
OpenClaw接入DeepSeek V4。
OpenClaw最新版本已将国产大模型DeepSeek V4 Flash设为默认模型，并同步上线V4 Pro，此次更新还强化了实时语音、会议协作和浏览器自动化能力。
OpenClaw大更新：接入DeepSeek V4。
OpenClaw发布“2026.4.24”版本，正式接入DeepSeek V4模型，并深度集成Google Meet，支持实时会话处理、产出物导出等，旨在提升生产力。
记忆，是 Agent 基建。
OpenChronicle项目负责人Calvin认为AI记忆功能正从产品特性演变为Agent基建，OpenChronicle作为开源解决方案，旨在让用户掌握AI记忆所有权，并支持主动式Agent。
Proactive Agent的野心和现实。
Proactive Agent概念兴起，它能主动发现并执行任务，而非被动等待指令。AirJelly、Boxy等新产品各有创新，但Agent创业的核心挑战仍在于明确用户需求和商业模式。

具身智能

李力耘加入众擎机器人。
前小鹏汽车自动驾驶一号位李力耘正式加入众擎机器人，将为众擎带来全栈智驾大脑能力，补齐具身智能“全栈拼图”，助力众擎从“能打”到“能干”转变。
帕西尼许晋诚谈触觉传感器。
帕西尼创始人许晋诚表示，公司已完成从传感器到具身大脑的全栈布局，并凭借霍尔触觉传感器和颠覆性定价获得市场认可，撬动万亿具身智能市场。
清华大学丁宁成立具身智能大脑公司。
清华大学助理教授丁宁成立具身智能大脑公司「自然意志」，已获IDG资本、峰瑞资本、真格基金天使轮投资，公司估值高达40亿人民币，聚焦具身大脑方向。
3D 重建是下一代模型的空间基础能力。
3D 重建技术正从离线场景恢复走向持续空间能力，融入在线更新、跨设备加载、浏览器分发等链路，将成为机器人仿真、视觉定位、空间编辑和世界生成等下一代模型的核心基础。

AI 行业观察

AI最疯狂的一周：8大共识。
2026中国生成式AI大会揭示AI竞争核心转向“干活”，中美头部梯队形成，中国AI在开源和成本效率上具竞争力，大模型能力提升需RLVR、工具使用与上下文管理。
谷歌亚马逊砸钱养竞争对手。
谷歌和亚马逊向AI公司Anthropic投资超650亿美元，并非单纯股权投资，而是以“算力预售”模式锁定大客户，确保其云服务和芯片产能消耗，重塑云市场竞争格局。
Meta员工刷Token作弊。
Meta内部AI用量排行榜“Claudeonomics”引发员工刷榜，有人一个月烧掉200万美元Token，甚至写外挂作弊。该榜单后被撤下，折射出将Token消耗量等同于生产力的管理误区。
Epoch AI万人调研：老板不订阅，AI就是摆设。
Epoch AI调研显示，公司为AI工具付费能将员工工作使用率从38%提升至76%。AI正引发职场分化，Copilot因生态位优势在职场应用中领跑。

AI 应用创新

Agnes AI推出Token Plan订阅套餐。
Agnes AI推出Token Plan订阅套餐，用户可按月无限次调用自研模型，起售价4美元。其自研模型AgnesClaw家族在性能和成本上具优势，并推出Pavo、Echo两款应用。
Claude免费开放AI动态图表功能。
Anthropic的Claude现已免费开放交互式图表、流程图和可视化功能，用户可在对话中直接生成并点击展开详细信息，预示AI正从纯文本向“画给你看”发展。
剪映上线AI助手。
剪映APP上线“AI助手”功能，通过自然语言交互，实现批量剪辑、素材调用、智能文案、一键成片等高级能力，大幅降低视频创作门槛，提升效率。
欧莱雅将AI融入美妆创新。
欧莱雅BRANDSTORM 2026中国总决赛落幕，AI成为美妆创新核心议题。欧莱雅与英伟达合作将AI融入研发，并利用生成式AI加速营销内容生产，同时推出AI美妆助手。
AI长视频风起，爱奇艺们的出路。
爱奇艺CEO龚宇关于AI影视的言论引发争议，长视频平台面临营收下滑与短剧冲击，急于通过AI降本增效，但AI艺人库和AI剧作的落地仍面临挑战。

其他

AI春训营正式启动报名。
Datawhale 2026 AI春训营正式启动报名，该训练营由Datawhale联合头部科技企业主办，聚焦场景引领、任务驱动和成果落地，旨在提升学习者AI专业能力与就业竞争力。
固定实体架构降低知识图谱构建成本。
文章介绍一种固定实体架构（FEA），通过人工定义本体、数学相似度计算和HyDE技术，将知识图谱构建成本降低95%，并提升了质量与可维护性。
Nature：AI4S+机器人闭环研发框架。
香港城市大学朱宗龙、曾晓成团队在《Nature》发表研究，首创AI4S+机器人闭环研发框架，将钙钛矿太阳能电池制造可重复性提升5倍，并刷新稳态效率纪录。
奥特曼就公司未预警枪击案嫌疑人道歉。
OpenAI CEO Sam Altman就公司未预警枪击案嫌疑人向公众道歉。公司曾封禁嫌疑人ChatGPT账号，但未向警方通报，引发AI平台风险识别与监管争议。
Meta Ray-Ban Blayzer Optics上手。
Meta与Ray-Ban合作推出的新款智能眼镜Blayzer Optics，通过框型重构、可替换鼻托、镜腿外扩等设计，显著提升了佩戴舒适度，使其更适合日常佩戴。
大学生重仓英特尔股票浮盈近3倍。
2024年，一位大学生用奶奶遗产重仓英特尔股票，买入后股价暴跌，被嘲讽为“最惨受害者”。但随着英特尔战略调整和股价反弹，其投资或已浮盈近3倍。