乐于分享
好东西不私藏

AI情报助手日报04-27

AI情报助手日报04-27

AI 模型进展

  • GPT-5.5 Pro视觉智商破纪录。
    LisanBench测试显示,GPT-5.5 Pro的视觉IQ高达145,首次达到门萨俱乐部天才水平,预示着认知视觉革命的到来。
  • 英伟达Lyra 2.0单图造3D世界。
    Lyra 2.0能将单张图片转化为可探索的3D交互世界,通过“几何导航,像素创作”解决了3D生成中的“空间遗忘”和“时间漂移”难题。
  • 全球首个医疗视频大模型开源。
    联影智能开源uAI Nexus MedVLM,这是全球规模最大、性能最强的医疗视频理解大模型,能看懂手术视频,并在多项指标上远超GPT-5.4和Gemini-3.1。
  • MoE模型“专家升级”省算力。
    亚马逊团队提出“专家升级”方法,通过在持续预训练期间增加专家数量,逐步扩展MoE模型容量,能在推理成本不变的前提下提升模型质量并节省GPU算力。
  • 月之暗面发布Kimi K2.6并开源。
    Kimi K2.6是月之暗面迄今最强代码模型,增强了Agent自主执行能力。DeepSeek-V4预览版也已上线并开源,支持英伟达和华为昇腾NPU。
  • 大模型高效推理新方法ReBalance。
    哈尔滨工业大学(深圳)等机构提出ReBalance方法,引入“Balanced Thinking”新视角,解决大模型推理“过度思考”问题,精度提升10.0%的同时推理长度直降35.4%。
  • MathForge提升大模型数学推理。
    中国人民大学等团队提出MathForge框架,通过难度感知组策略优化和多方面问题改写,让大模型在强化学习中更有效攻克难题,显著提升数学推理能力。

AI Agent

  • 斯坦福新框架:AI Agent能自证。
    斯坦福大学联合伯克利、英伟达推出LLM-as-a-Verifier框架,通过扩展验证计算,显著提升Agent性能,在AI编程基准上超越GPT-5.5和Claude Mythos。
  • AI谈判:强模型多赚70%。
    Anthropic实验发现,强AI代理(Opus)在谈判中比弱AI代理(Haiku)多赚70%,但使用弱AI的用户并未察觉自己吃亏,这可能加剧社会不平等。
  • OpenClaw接入DeepSeek V4。
    OpenClaw最新版本已将国产大模型DeepSeek V4 Flash设为默认模型,并同步上线V4 Pro,此次更新还强化了实时语音、会议协作和浏览器自动化能力。
  • OpenClaw大更新:接入DeepSeek V4。
    OpenClaw发布“2026.4.24”版本,正式接入DeepSeek V4模型,并深度集成Google Meet,支持实时会话处理、产出物导出等,旨在提升生产力。
  • 记忆,是 Agent 基建。
    OpenChronicle项目负责人Calvin认为AI记忆功能正从产品特性演变为Agent基建,OpenChronicle作为开源解决方案,旨在让用户掌握AI记忆所有权,并支持主动式Agent。
  • Proactive Agent的野心和现实。
    Proactive Agent概念兴起,它能主动发现并执行任务,而非被动等待指令。AirJelly、Boxy等新产品各有创新,但Agent创业的核心挑战仍在于明确用户需求和商业模式。

具身智能

  • 李力耘加入众擎机器人。
    前小鹏汽车自动驾驶一号位李力耘正式加入众擎机器人,将为众擎带来全栈智驾大脑能力,补齐具身智能“全栈拼图”,助力众擎从“能打”到“能干”转变。
  • 帕西尼许晋诚谈触觉传感器。
    帕西尼创始人许晋诚表示,公司已完成从传感器到具身大脑的全栈布局,并凭借霍尔触觉传感器和颠覆性定价获得市场认可,撬动万亿具身智能市场。
  • 清华大学丁宁成立具身智能大脑公司。
    清华大学助理教授丁宁成立具身智能大脑公司「自然意志」,已获IDG资本、峰瑞资本、真格基金天使轮投资,公司估值高达40亿人民币,聚焦具身大脑方向。
  • 3D 重建是下一代模型的空间基础能力。
    3D 重建技术正从离线场景恢复走向持续空间能力,融入在线更新、跨设备加载、浏览器分发等链路,将成为机器人仿真、视觉定位、空间编辑和世界生成等下一代模型的核心基础。

AI 行业观察

  • AI最疯狂的一周:8大共识。
    2026中国生成式AI大会揭示AI竞争核心转向“干活”,中美头部梯队形成,中国AI在开源和成本效率上具竞争力,大模型能力提升需RLVR、工具使用与上下文管理。
  • 谷歌亚马逊砸钱养竞争对手。
    谷歌和亚马逊向AI公司Anthropic投资超650亿美元,并非单纯股权投资,而是以“算力预售”模式锁定大客户,确保其云服务和芯片产能消耗,重塑云市场竞争格局。
  • Meta员工刷Token作弊。
    Meta内部AI用量排行榜“Claudeonomics”引发员工刷榜,有人一个月烧掉200万美元Token,甚至写外挂作弊。该榜单后被撤下,折射出将Token消耗量等同于生产力的管理误区。
  • Epoch AI万人调研:老板不订阅,AI就是摆设。
    Epoch AI调研显示,公司为AI工具付费能将员工工作使用率从38%提升至76%。AI正引发职场分化,Copilot因生态位优势在职场应用中领跑。

AI 应用创新

  • Agnes AI推出Token Plan订阅套餐。
    Agnes AI推出Token Plan订阅套餐,用户可按月无限次调用自研模型,起售价4美元。其自研模型AgnesClaw家族在性能和成本上具优势,并推出Pavo、Echo两款应用。
  • Claude免费开放AI动态图表功能。
    Anthropic的Claude现已免费开放交互式图表、流程图和可视化功能,用户可在对话中直接生成并点击展开详细信息,预示AI正从纯文本向“画给你看”发展。
  • 剪映上线AI助手。
    剪映APP上线“AI助手”功能,通过自然语言交互,实现批量剪辑、素材调用、智能文案、一键成片等高级能力,大幅降低视频创作门槛,提升效率。
  • 欧莱雅将AI融入美妆创新。
    欧莱雅BRANDSTORM 2026中国总决赛落幕,AI成为美妆创新核心议题。欧莱雅与英伟达合作将AI融入研发,并利用生成式AI加速营销内容生产,同时推出AI美妆助手。
  • AI长视频风起,爱奇艺们的出路。
    爱奇艺CEO龚宇关于AI影视的言论引发争议,长视频平台面临营收下滑与短剧冲击,急于通过AI降本增效,但AI艺人库和AI剧作的落地仍面临挑战。

其他

  • AI春训营正式启动报名。
    Datawhale 2026 AI春训营正式启动报名,该训练营由Datawhale联合头部科技企业主办,聚焦场景引领、任务驱动和成果落地,旨在提升学习者AI专业能力与就业竞争力。
  • 固定实体架构降低知识图谱构建成本。
    文章介绍一种固定实体架构(FEA),通过人工定义本体、数学相似度计算和HyDE技术,将知识图谱构建成本降低95%,并提升了质量与可维护性。
  • Nature:AI4S+机器人闭环研发框架。
    香港城市大学朱宗龙、曾晓成团队在《Nature》发表研究,首创AI4S+机器人闭环研发框架,将钙钛矿太阳能电池制造可重复性提升5倍,并刷新稳态效率纪录。
  • 奥特曼就公司未预警枪击案嫌疑人道歉。
    OpenAI CEO Sam Altman就公司未预警枪击案嫌疑人向公众道歉。公司曾封禁嫌疑人ChatGPT账号,但未向警方通报,引发AI平台风险识别与监管争议。
  • Meta Ray-Ban Blayzer Optics上手。
    Meta与Ray-Ban合作推出的新款智能眼镜Blayzer Optics,通过框型重构、可替换鼻托、镜腿外扩等设计,显著提升了佩戴舒适度,使其更适合日常佩戴。
  • 大学生重仓英特尔股票浮盈近3倍。
    2024年,一位大学生用奶奶遗产重仓英特尔股票,买入后股价暴跌,被嘲讽为“最惨受害者”。但随着英特尔战略调整和股价反弹,其投资或已浮盈近3倍。