AI情报助手日报05-01-夜雨聆风

AI情报助手日报05-01

AI 应用与工具

IBM Bob 发布企业级 AI 开发伙伴。
IBM 正式发布企业级 AI 开发伙伴 Bob，旨在贯穿软件开发全生命周期，提供多模型编排、内置安全控制及可审计性。
Cursor SDK 正式发布。
Cursor 正式发布 TypeScript SDK，将智能代理运行时打包成可编程组件，支持模型无关、双模部署，能驱动 Cursor 脱离 IDE 工作。
Hermes 推出 Curator 功能。
Hermes 推出 Curator 功能，旨在解决 AI 助手 Skill 仓库膨胀问题，自动标记并归档长期未使用的技能，提升技能管理体验。
热门 Agent Skill 精选。
本文精选并介绍了多款热门 Agent Skills，涵盖技能发现、创建、前端设计、视频创作、多媒体、浏览器、云平台、AIGC 及代码质量等领域。
爱奇艺发布纳逗 Pro 影视制作平台。
爱奇艺发布专业级影视制作平台纳逗 Pro，通过 AI 技术赋能影视创作全流程，生成影视级内容，解决传统制作痛点。
微软 AI 业务狂飙123%。
微软2026财年 Q3 营收829亿美元，同比增长18%。AI 业务年收入超370亿美元，同比增长123%，成为核心增长支柱。
Excel 凭借 AI 重塑企业工作模式。
文章反思科技界对大语言模型过度关注，认为 Microsoft Excel 才是真正的颠覆者，凭借无代码特性和集成 AI，重塑企业工作模式。

大模型进展

DeepSeekV4 与美团 LongCat 突破万亿参数。
DeepSeek V4与美团 LongCat-2.0-Preview 大模型参数均突破万亿，且支持1M超长上下文，标志着中国AI企业正铺设自主轨道。
Ling-2.6 开源万亿参数模型。
inclusionAI 开源 Ling-2.6，该模型兼顾推理效率与令牌开销，在多项执行类基准测试中达到开源 SOTA 水平。
谷歌 DeepResearch 智能体“自动驾驶”。
谷歌推出 DeepResearch 智能体，基于 Gemini 3.1 Pro 模型，能自主搜索、分析数据并生成带图表的报告，将取代部分基础研究工作。
OpenAI GPT-5.6 后台曝光。
OpenAI 的 GPT-5.6 模型已在后台日志中曝光，同时 GPT-5.5 因训练中奖励信号泛化，出现“哥布林”迷恋怪癖，导致 OpenAI 紧急封禁。
Talkie 模型探索 AI 自主推演知识。
GPT之父 Alec Radford 团队训练了一个知识截止到1930年的13B模型 Talkie，用于评估大模型能力、解决训练数据污染问题。
Claude Mythos 生物信息学超专家。
Anthropic 发布 BioMysteryBench 评测集，Claude Mythos 在人类可解题上准确率达82.6%，并能解决部分人类专家无法解答的难题。
LLM Python 库重构拥抱多模态。
LLM Python 库发布0.32a0版本，重构核心抽象层以适应大模型多模态输入、结构化输出和工具调用等新能力。

具身智能与机器人

世界模型成 AI 产业显学。
世界模型正成为 AI 产业显学，渗透具身智能、自动驾驶、3D世界生成等领域，旨在实现对物理世界的理解与预测。
清华 WorldArena 评测世界模型。
清华团队推出 WorldArena 评测框架，旨在检验世界模型能否从“生成世界”走向“使用世界”，强调物理一致性与动作驱动能力。
中国公司魔法原子发布具身智能全栈技术。
中国公司魔法原子在硅谷举办全球具身智能创新大会，发布世界模型 Magic-Mix、灵巧手 H01 和人形机器人 X1。
宇树发布上半身人形机器人。
宇树科技发布仅有上半身设计的双臂人形机器人，定价2.69万元起，大幅拉低行业门槛，并否认熊猫机器人抄袭魔法原子。
宇树人形机器人杀入2万档。
宇树科技发布 R1 系列双臂人形机器人，起售价2.69万元，创商业化人形机器人价格新低，主打上半身双臂操作，可应用于工业和家庭场景。
智元机器人 LWD 框架实现边部署边进化。
智元机器人发布 LWD 框架，通过强化学习驱动数据飞轮，使机器人集群在真实任务中从自身交互经验中持续自主改进。
凌迪科技入局具身智能。
服装科技巨头凌迪科技发布 SynReal 系统，以其十年积累的柔性3D仿真技术解决具身智能机器人训练难题，有望推动“物理AI”时代到来。
深圳小象电动攻克机器人关节电机量产。
深圳小象电动攻克机器人关节电机量产难题，其轴向磁通电机已累计出货近7万台，进入华为、比亚迪等头部企业供应链。
高校具身智能联盟知识库上线。
高校具身智能联盟正式上线具身知识库，汇聚万余名产学研投社群成员智慧，旨在为具身智能行业提供开放、持续生长的知识基础设施。

AI 行业动态

马斯克庭审手撕 OpenAI。
马斯克在法庭指控 OpenAI 违背非营利使命，转向“封顶利润”结构并接受微软投资，认为 OpenAI 偏离了“造福人类”的初衷。
马斯克指控 OpenAI 背弃非营利使命。
马斯克与奥尔特曼的庭审开庭，马斯克指控 OpenAI 背弃非营利使命，同时 OpenAI 模型接入 AWS，GPT Image 2 登顶视觉模型榜首。
软银 AI 新实体 Roze AI 计划 IPO。
软银集团正组建 AI 与机器人公司 Roze AI，旨在提升 AI 物理基础设施效率，计划最早于今年下半年 IPO，目标估值高达1000亿美元。
ChatGPT 用户流失，OpenAI 陷 IPO 困境。
ChatGPT 用户卸载量激增，月活跃用户增长放缓，OpenAI 正面临营收与用户增长困境，可能影响其 IPO 计划。
《时代》评选十大最具影响力 AI 公司。
《时代》杂志发布2026年“十大最具影响力 AI 公司”名单，字节跳动、阿里巴巴、智谱三家中国公司入选。
谷歌 Cloud Next 26 聚焦“智能体企业”。
Google Cloud Next 26 大会以“智能体企业”为核心，发布全栈 AI 智能体技术，助力企业迈入 AI 智能体规模化落地新阶段。
NVIDIA 创业企业展示聚焦物理 AI。
NVIDIA 在北京举办“2026创业企业展示”活动，聚焦物理 AI 与代理式 AI，汇聚180余位创业者、投资人，助力 AI 创新生态发展。
AI 时代 CEO 恐惧企业价值被绕过。
AI 时代，CEO 们真正的恐惧并非不使用 AI，而是企业价值被悄然绕过。AI 正重写价值链，导致中间层企业面临被替代风险。

AI 算力与成本

AI 服务集体涨价，打工人“赢麻”。
AI 服务自3月起集体涨价，Token 配额缩减，导致使用成本飙升。文章指出，算力通胀使 AI 使用场景发生巨变，打工人反而因其高性价比而“赢麻了”。
OpenAI 算力提前三年达标。
OpenAI 的“星际之门”计划原定2029年建成10GW算力，目前已提前三年超额完成目标，为满足 AI 需求，OpenAI 持续扩建算力。
英伟达市值重回5万亿美元。
英伟达市值在 DeepSeek V4 发布后，首次连续站上5万亿美元关口，得益于“杰文斯悖论”效应和 GPU 产品在市场上的抢手表现。
四大科技巨头上调 AI 资本支出。
AI 热潮下，Alphabet、Meta、微软、亚马逊四大科技巨头，将2026年资本支出预期上调至超7000亿美元，主要因零部件价格上涨和数据中心扩张。

AI 安全与可解释性

Anthropic 推出“内省适配器”技术。
Anthropic 发布“内省适配器”技术，通过轻量级 LoRA 插件，让大模型用自然语言“坦白”微调中学到的隐藏行为，包括加密后门。
大模型“黑箱”变“玻璃箱”。
ACL 2026 综述提出“内生可解释性”，旨在将解释性直接嵌入模型结构与训练目标，使解释成为模型一部分，提升大模型透明度。

arXiv 论文

ComboStoc：扩散模型训练新框架。
ComboStoc 通过向量化扩散时间步，充分利用数据维度和属性的组合复杂性，显著加速了图像和3D形状的训练，并提升了生成质量。
DP-CDA：增强数据集合成隐私保护。
DP-CDA 算法通过随机混合和引入高斯噪声，生成具有差分隐私保证的合成数据，在保持严格隐私水平的同时，实现了更高的效用。
ElementBERT：化学元素语义嵌入。
ElementBERT 框架利用领域特定BERT模型，从129万篇合金论文摘要中生成化学元素语义嵌入，预测材料性能精度最高提升23%。

其他

清华团队预言“零人公司”时代。
清华沈阳团队预言，AI 正走向“人机隔离”，未来公司或仅剩一人甚至零人。90%的人将脱离谋生劳动，社会将进入“多版本现实”。
复旦北大 AHE 框架让 Agent 实现自改。
复旦与北大团队联合提出 AHE 框架，使代码 Agent 通过自读轨迹、自改 Harness 实现自动化演进，10轮迭代后性能超越人类设计。
智谱 AI 分享 Coding Agent 推理实践。
智谱 AI 团队分享超大规模 Coding Agent 推理实践经验，通过修复底层竞态 Bug 并优化系统瓶颈，显著提升推理系统稳定性和效率。
新加坡国立大学 ViF 压制多智能体视觉幻觉。
新加坡国立大学等研究人员提出 ViF（Visual Flow）范式，通过重构智能体间视觉传递逻辑，有效压制多智能体视觉幻觉“滚雪球”效应。
DIGER 论文首次实现生成式推荐可微分联合优化。
DIGER 论文首次将可微分语义索引机制引入生成式推荐框架，让推荐损失直接参与语义 ID 学习，并在多个公开数据集上取得一致提升。
CVPR 2026 关注动态视觉智能体。
CVPR 2026 最新研究显示，计算机视觉领域正从“高精度求解器”转向“在不完美条件下持续理解世界”的动态视觉智能体。
BIGAI 与上交大提出 EAR 范式。
BIGAI 与上交大提出 EAR 范式，将视觉规划重构为单步图像编辑任务，并构建 AMAZE 基准，测试图像编辑模型的视觉规划能力。
谷歌 AI 研究智能体 DeepResearch。
谷歌推出 DeepResearch 智能体，基于 Gemini 3.1 Pro 模型，能自主搜索、分析数据并生成带图表的报告，将取代部分基础研究工作。
华为携手中科大发布“灵境造物”平台。
中国科学技术大学发布“灵境造物”智能科研云平台，面向全球开放使用。华为 openJiuwen 社区提供 Coordination Engineering 全栈支撑。
追觅发布模块化手机及 AI 眼镜。
追觅在旧金山发布模块化手机 Aurora Nex、AI 眼镜、智能戒指及火箭超跑概念车。苹果联合创始人斯蒂夫·沃兹尼亚克出席并赞赏追觅创新。
追觅扫地机发布新品。
追觅扫地机在硅谷发布新品，推出第二代仿生机械臂、160℃蒸汽清洁和 Cyber X 爬楼机等全球首创技术，占据高端扫地机器人市场领先地位。
HooRii 公司 ClawStage 众筹失败。
HooRii 公司 AI 陪伴硬件 ClawStage 众筹仅获56万美元，远低于同类产品，被证实为失败尝试，未能满足用户对生产力工具的需求。
Open Source Fantasy League 2026 赛季注册开放。
Open Source Fantasy League 2026 赛季注册现已开放，公布了新的规则变更，通过选秀开源维护者并根据项目表现得分。
AI 火种车第二期甘肃宕昌结项。
AI 火种车第二期项目在甘肃宕昌县四所学校完成，旨在建立可复制的 AI 教育标准化体系，帮助师生从“看见 AI”到“真正用 AI”。
抖音 AI 爆款视频观察。
新榜数据分析抖音上百条 AI 爆款视频，发现 AI 正重塑内容生态，转场变装成最火赛道，真人+AI 仍是主流，但商业变现仍面临挑战。
陶哲轩：AI 生成证明速度远超人类消化。
陶哲轩判断数学正从“证明稀缺”进入“证明过剩”时代，AI 生成证明速度远超人类消化能力，未来数学家核心竞争力将转向验证和消化。
DeepSeek 识图模式灰度测试。
DeepSeek 识图模式正进行灰度测试，实测显示其可能是独立于 V4 的新模型，具备快速识图和 OCR 能力，深度思考模式可提升推理准确性。
小红书组织大变革，柯南任总裁。
小红书宣布新一轮组织升级，柯南（丁玲）出任总裁，全面整合社区、电商、商业化三大核心业务及技术体系，并成立 AI 一级部门 Dots。
成都各区公办幼儿园报名时间汇总。
成都各区县市已公布2026年公办幼儿园招生公告，报名时间汇总表已更新，非本地户籍家长在部分区域可线上报名。