AI情报助手日报05-01
AI 应用与工具
-
IBM Bob 发布企业级 AI 开发伙伴。
IBM 正式发布企业级 AI 开发伙伴 Bob,旨在贯穿软件开发全生命周期,提供多模型编排、内置安全控制及可审计性。 -
Cursor SDK 正式发布。
Cursor 正式发布 TypeScript SDK,将智能代理运行时打包成可编程组件,支持模型无关、双模部署,能驱动 Cursor 脱离 IDE 工作。 -
Hermes 推出 Curator 功能。
Hermes 推出 Curator 功能,旨在解决 AI 助手 Skill 仓库膨胀问题,自动标记并归档长期未使用的技能,提升技能管理体验。 -
热门 Agent Skill 精选。
本文精选并介绍了多款热门 Agent Skills,涵盖技能发现、创建、前端设计、视频创作、多媒体、浏览器、云平台、AIGC 及代码质量等领域。 -
爱奇艺发布纳逗 Pro 影视制作平台。
爱奇艺发布专业级影视制作平台纳逗 Pro,通过 AI 技术赋能影视创作全流程,生成影视级内容,解决传统制作痛点。 -
微软 AI 业务狂飙123%。
微软2026财年 Q3 营收829亿美元,同比增长18%。AI 业务年收入超370亿美元,同比增长123%,成为核心增长支柱。 -
Excel 凭借 AI 重塑企业工作模式。
文章反思科技界对大语言模型过度关注,认为 Microsoft Excel 才是真正的颠覆者,凭借无代码特性和集成 AI,重塑企业工作模式。
大模型进展
-
DeepSeekV4 与美团 LongCat 突破万亿参数。
DeepSeek V4与美团 LongCat-2.0-Preview 大模型参数均突破万亿,且支持1M超长上下文,标志着中国AI企业正铺设自主轨道。 -
Ling-2.6 开源万亿参数模型。
inclusionAI 开源 Ling-2.6,该模型兼顾推理效率与令牌开销,在多项执行类基准测试中达到开源 SOTA 水平。 -
谷歌 DeepResearch 智能体“自动驾驶”。
谷歌推出 DeepResearch 智能体,基于 Gemini 3.1 Pro 模型,能自主搜索、分析数据并生成带图表的报告,将取代部分基础研究工作。 -
OpenAI GPT-5.6 后台曝光。
OpenAI 的 GPT-5.6 模型已在后台日志中曝光,同时 GPT-5.5 因训练中奖励信号泛化,出现“哥布林”迷恋怪癖,导致 OpenAI 紧急封禁。 -
Talkie 模型探索 AI 自主推演知识。
GPT之父 Alec Radford 团队训练了一个知识截止到1930年的13B模型 Talkie,用于评估大模型能力、解决训练数据污染问题。 -
Claude Mythos 生物信息学超专家。
Anthropic 发布 BioMysteryBench 评测集,Claude Mythos 在人类可解题上准确率达82.6%,并能解决部分人类专家无法解答的难题。 -
LLM Python 库重构拥抱多模态。
LLM Python 库发布0.32a0版本,重构核心抽象层以适应大模型多模态输入、结构化输出和工具调用等新能力。
具身智能与机器人
-
世界模型成 AI 产业显学。
世界模型正成为 AI 产业显学,渗透具身智能、自动驾驶、3D世界生成等领域,旨在实现对物理世界的理解与预测。 -
清华 WorldArena 评测世界模型。
清华团队推出 WorldArena 评测框架,旨在检验世界模型能否从“生成世界”走向“使用世界”,强调物理一致性与动作驱动能力。 -
中国公司魔法原子发布具身智能全栈技术。
中国公司魔法原子在硅谷举办全球具身智能创新大会,发布世界模型 Magic-Mix、灵巧手 H01 和人形机器人 X1。 -
宇树发布上半身人形机器人。
宇树科技发布仅有上半身设计的双臂人形机器人,定价2.69万元起,大幅拉低行业门槛,并否认熊猫机器人抄袭魔法原子。 -
宇树人形机器人杀入2万档。
宇树科技发布 R1 系列双臂人形机器人,起售价2.69万元,创商业化人形机器人价格新低,主打上半身双臂操作,可应用于工业和家庭场景。 -
智元机器人 LWD 框架实现边部署边进化。
智元机器人发布 LWD 框架,通过强化学习驱动数据飞轮,使机器人集群在真实任务中从自身交互经验中持续自主改进。 -
凌迪科技入局具身智能。
服装科技巨头凌迪科技发布 SynReal 系统,以其十年积累的柔性3D仿真技术解决具身智能机器人训练难题,有望推动“物理AI”时代到来。 -
深圳小象电动攻克机器人关节电机量产。
深圳小象电动攻克机器人关节电机量产难题,其轴向磁通电机已累计出货近7万台,进入华为、比亚迪等头部企业供应链。 -
高校具身智能联盟知识库上线。
高校具身智能联盟正式上线具身知识库,汇聚万余名产学研投社群成员智慧,旨在为具身智能行业提供开放、持续生长的知识基础设施。
AI 行业动态
-
马斯克庭审手撕 OpenAI。
马斯克在法庭指控 OpenAI 违背非营利使命,转向“封顶利润”结构并接受微软投资,认为 OpenAI 偏离了“造福人类”的初衷。 -
马斯克指控 OpenAI 背弃非营利使命。
马斯克与奥尔特曼的庭审开庭,马斯克指控 OpenAI 背弃非营利使命,同时 OpenAI 模型接入 AWS,GPT Image 2 登顶视觉模型榜首。 -
软银 AI 新实体 Roze AI 计划 IPO。
软银集团正组建 AI 与机器人公司 Roze AI,旨在提升 AI 物理基础设施效率,计划最早于今年下半年 IPO,目标估值高达1000亿美元。 -
ChatGPT 用户流失,OpenAI 陷 IPO 困境。
ChatGPT 用户卸载量激增,月活跃用户增长放缓,OpenAI 正面临营收与用户增长困境,可能影响其 IPO 计划。 -
《时代》评选十大最具影响力 AI 公司。
《时代》杂志发布2026年“十大最具影响力 AI 公司”名单,字节跳动、阿里巴巴、智谱三家中国公司入选。 -
谷歌 Cloud Next 26 聚焦“智能体企业”。
Google Cloud Next 26 大会以“智能体企业”为核心,发布全栈 AI 智能体技术,助力企业迈入 AI 智能体规模化落地新阶段。 -
NVIDIA 创业企业展示聚焦物理 AI。
NVIDIA 在北京举办“2026创业企业展示”活动,聚焦物理 AI 与代理式 AI,汇聚180余位创业者、投资人,助力 AI 创新生态发展。 -
AI 时代 CEO 恐惧企业价值被绕过。
AI 时代,CEO 们真正的恐惧并非不使用 AI,而是企业价值被悄然绕过。AI 正重写价值链,导致中间层企业面临被替代风险。
AI 算力与成本
-
AI 服务集体涨价,打工人“赢麻”。
AI 服务自3月起集体涨价,Token 配额缩减,导致使用成本飙升。文章指出,算力通胀使 AI 使用场景发生巨变,打工人反而因其高性价比而“赢麻了”。 -
OpenAI 算力提前三年达标。
OpenAI 的“星际之门”计划原定2029年建成10GW算力,目前已提前三年超额完成目标,为满足 AI 需求,OpenAI 持续扩建算力。 -
英伟达市值重回5万亿美元。
英伟达市值在 DeepSeek V4 发布后,首次连续站上5万亿美元关口,得益于“杰文斯悖论”效应和 GPU 产品在市场上的抢手表现。 -
四大科技巨头上调 AI 资本支出。
AI 热潮下,Alphabet、Meta、微软、亚马逊四大科技巨头,将2026年资本支出预期上调至超7000亿美元,主要因零部件价格上涨和数据中心扩张。
AI 安全与可解释性
-
Anthropic 推出“内省适配器”技术。
Anthropic 发布“内省适配器”技术,通过轻量级 LoRA 插件,让大模型用自然语言“坦白”微调中学到的隐藏行为,包括加密后门。 -
大模型“黑箱”变“玻璃箱”。
ACL 2026 综述提出“内生可解释性”,旨在将解释性直接嵌入模型结构与训练目标,使解释成为模型一部分,提升大模型透明度。
arXiv 论文
-
ComboStoc:扩散模型训练新框架。
ComboStoc 通过向量化扩散时间步,充分利用数据维度和属性的组合复杂性,显著加速了图像和3D形状的训练,并提升了生成质量。 -
DP-CDA:增强数据集合成隐私保护。
DP-CDA 算法通过随机混合和引入高斯噪声,生成具有差分隐私保证的合成数据,在保持严格隐私水平的同时,实现了更高的效用。 -
ElementBERT:化学元素语义嵌入。
ElementBERT 框架利用领域特定BERT模型,从129万篇合金论文摘要中生成化学元素语义嵌入,预测材料性能精度最高提升23%。
其他
-
清华团队预言“零人公司”时代。
清华沈阳团队预言,AI 正走向“人机隔离”,未来公司或仅剩一人甚至零人。90%的人将脱离谋生劳动,社会将进入“多版本现实”。 -
复旦北大 AHE 框架让 Agent 实现自改。
复旦与北大团队联合提出 AHE 框架,使代码 Agent 通过自读轨迹、自改 Harness 实现自动化演进,10轮迭代后性能超越人类设计。 -
智谱 AI 分享 Coding Agent 推理实践。
智谱 AI 团队分享超大规模 Coding Agent 推理实践经验,通过修复底层竞态 Bug 并优化系统瓶颈,显著提升推理系统稳定性和效率。 -
新加坡国立大学 ViF 压制多智能体视觉幻觉。
新加坡国立大学等研究人员提出 ViF(Visual Flow)范式,通过重构智能体间视觉传递逻辑,有效压制多智能体视觉幻觉“滚雪球”效应。 -
DIGER 论文首次实现生成式推荐可微分联合优化。
DIGER 论文首次将可微分语义索引机制引入生成式推荐框架,让推荐损失直接参与语义 ID 学习,并在多个公开数据集上取得一致提升。 -
CVPR 2026 关注动态视觉智能体。
CVPR 2026 最新研究显示,计算机视觉领域正从“高精度求解器”转向“在不完美条件下持续理解世界”的动态视觉智能体。 -
BIGAI 与上交大提出 EAR 范式。
BIGAI 与上交大提出 EAR 范式,将视觉规划重构为单步图像编辑任务,并构建 AMAZE 基准,测试图像编辑模型的视觉规划能力。 -
谷歌 AI 研究智能体 DeepResearch。
谷歌推出 DeepResearch 智能体,基于 Gemini 3.1 Pro 模型,能自主搜索、分析数据并生成带图表的报告,将取代部分基础研究工作。 -
华为携手中科大发布“灵境造物”平台。
中国科学技术大学发布“灵境造物”智能科研云平台,面向全球开放使用。华为 openJiuwen 社区提供 Coordination Engineering 全栈支撑。 -
追觅发布模块化手机及 AI 眼镜。
追觅在旧金山发布模块化手机 Aurora Nex、AI 眼镜、智能戒指及火箭超跑概念车。苹果联合创始人斯蒂夫·沃兹尼亚克出席并赞赏追觅创新。 -
追觅扫地机发布新品。
追觅扫地机在硅谷发布新品,推出第二代仿生机械臂、160℃蒸汽清洁和 Cyber X 爬楼机等全球首创技术,占据高端扫地机器人市场领先地位。 -
HooRii 公司 ClawStage 众筹失败。
HooRii 公司 AI 陪伴硬件 ClawStage 众筹仅获56万美元,远低于同类产品,被证实为失败尝试,未能满足用户对生产力工具的需求。 -
Open Source Fantasy League 2026 赛季注册开放。
Open Source Fantasy League 2026 赛季注册现已开放,公布了新的规则变更,通过选秀开源维护者并根据项目表现得分。 -
AI 火种车第二期甘肃宕昌结项。
AI 火种车第二期项目在甘肃宕昌县四所学校完成,旨在建立可复制的 AI 教育标准化体系,帮助师生从“看见 AI”到“真正用 AI”。 -
抖音 AI 爆款视频观察。
新榜数据分析抖音上百条 AI 爆款视频,发现 AI 正重塑内容生态,转场变装成最火赛道,真人+AI 仍是主流,但商业变现仍面临挑战。 -
陶哲轩:AI 生成证明速度远超人类消化。
陶哲轩判断数学正从“证明稀缺”进入“证明过剩”时代,AI 生成证明速度远超人类消化能力,未来数学家核心竞争力将转向验证和消化。 -
DeepSeek 识图模式灰度测试。
DeepSeek 识图模式正进行灰度测试,实测显示其可能是独立于 V4 的新模型,具备快速识图和 OCR 能力,深度思考模式可提升推理准确性。 -
小红书组织大变革,柯南任总裁。
小红书宣布新一轮组织升级,柯南(丁玲)出任总裁,全面整合社区、电商、商业化三大核心业务及技术体系,并成立 AI 一级部门 Dots。 -
成都各区公办幼儿园报名时间汇总。
成都各区县市已公布2026年公办幼儿园招生公告,报名时间汇总表已更新,非本地户籍家长在部分区域可线上报名。
夜雨聆风