AI前沿速递·5月10日|Agent爆发·新范式·文心5.1

AI FRONTIER · 2026.05.10

AI 前沿速递

每日精选 · 10 条重磅资讯

Hermes登顶·OpenAI新范式·文心5.1·DS融资·阶跃语音·蚂蚁Ring·高德ABot

5月10日AI Agent与多模态能力双重爆发：Hermes Agent以单日2710亿Token消耗登顶OpenRouter全球调用榜，国产开源模型成为Agent时代核心基础设施。同期OpenAI提出无需参数更新的强化学习新范式，谷歌DeepMind发布「AI联合数学家」系统刷新数学基准，百度文心5.1以仅业界6%的预训练成本登顶国内搜索榜，阶跃星辰语音模型登顶国产第一，蚂蚁百灵发布万亿参数Ring-2.6-1T，高德ABot夺冠全球具身智能挑战赛。DeepSeek500亿融资推进、V4.1定档6月，OpenAI关闭微调API引导生态重组，AI政策合规进入倒计时——AI从技术突破向规模化落地加速演进。

01 Agent应用 · 产业动态

Hermes Agent登顶OpenRouter全球调用榜，国产模型成Agent核心基础设施

Nous Research旗下Hermes Agent单日Token消耗量达2710亿，首次超越OpenClaw登顶OpenRouter全球调用榜首，累计消耗超6.37万亿Token。小米MiMo是Hermes Agent调用量最高的底层模型，标志着国产开源模型已成长为全球Agent应用落地的关键基础设施。此次登顶验证了Agent应用从“技术展示”向“真实规模化消耗”的关键跃迁。

2710亿

单日Token消耗

6.37万亿

累计Token消耗

小米MiMo

核心贡献模型

▸ 规模验证：Agent应用从展示走向真实规模化消耗，Token成本成核心竞争力

▸ 国产崛起：国产开源模型首次成为海外头部Agent应用的核心底座

来源：OpenRouter / Nous Research 2026-05-10

02 前沿研究 · 技术范式革新

OpenAI提出无需参数更新的强化学习新范式

OpenAI研究员翁家翌提出名为“启发式学习（HL）”的强化学习新范式，AI无需更新模型权重，仅需编写可执行代码（.py文件）即可完成决策优化。在Atari Breakout测试中，该范式达到864分（接近理论满分），且完全不需要神经网络训练。这一研究将“模型权重”与“行为策略”解耦，是强化学习领域的革命性突破。

864分

Atari Breakout得分

零权重更新

核心特点

纯代码决策

决策方式

▸ 范式革命：将模型权重与行为策略解耦，未来AI能力提升依赖代码生成而非权重更新

▸ 零训练成本：无需神经网络训练即可达到顶级游戏AI水平

来源：OpenAI研究团队 2026-05-10

03 AI科研应用 · 技术突破

谷歌DeepMind发布「AI联合数学家」系统，刷新数学推理基准SOTA

谷歌DeepMind正式发布可与数学家协同工作的AI研究助手「AI联合数学家」，在FrontierMath Tier 4高难度数学基准测试中准确率达48%，刷新当前SOTA。该系统采用异步有状态工作空间设计，通过Agentic编排实现能力跃升，已协助牛津大学数学家解决了群论领域悬置几十年的第21.10号问题。

48%

FrontierMath准确率

群论悬案

已解决问题

异步工作空间

技术架构

▸ 科研落地：AI在基础科研领域的应用进入实用阶段，可协助解决数十年未解的数学难题

▸ 架构创新：异步有状态工作空间设计实现能力跃升

来源：谷歌DeepMind 2026-05-10

04 AI模型 · 百度

百度文心大模型5.1发布，预训练成本仅业界6%登顶国内搜索榜

百度正式发布新一代文心大模型5.1，采用“多维弹性预训练”技术，参数规模压缩至文心5.0的约1/3，预训练成本仅为业界同规模模型的6%。该模型已在LMSYS LMArena搜索榜以1223分登顶国内第一、全球第四，同步上线百度千帆模型广场和文心一言官网，面向企业用户和开发者开放体验。

预训练成本（业界比）

1223分

LMArena搜索榜得分

1/3

参数压缩比（vs 文心5.0）

▸ 成本突破：预训练成本仅为业界同规模模型6%，打破“大模型必烧钱”认知

▸ 性能登顶：国内搜索榜第一，全球第四，国产大模型性价比领跑

来源：百度AI开发者大会 2026-05-10

05 资本动向 · DeepSeek

DeepSeek推进500亿融资、V4.1定档6月，新增多模态能力

国内AI大模型头部企业DeepSeek首轮融资推进顺利，目标规模最高达500亿元人民币（约73.5亿美元），若成功将创中国AI公司单轮融资最高纪录，创始人梁文锋个人出资200亿元占比40%，国家集成电路产业投资基金洽谈领投。同期官方确认DeepSeek-V4.1定档2026年6月发布，将新增图像与音频多模态理解能力。

500亿

融资目标（人民币）

200亿

梁文锋个人出资额

2026年6月

V4.1发布时间

▸ 融资纪录：若成功将创中国AI公司单轮融资最高纪录，国家队入场加持

▸ 多模态升级：V4.1新增图像与音频多模态能力，进一步缩小与海外模型差距

来源：投资圈消息 / DeepSeek官方 2026-05-10

06 AI模型 · 阶跃星辰

阶跃星辰StepAudio 2.5 Realtime登顶国产语音模型第一

阶跃星辰新一代实时语音大模型StepAudio 2.5 Realtime在全球权威语音评测榜单Artificial Analysis Speech Arena中位列中国语音模型第一，用户体验得分80.41，超越GPT-Realtime-1.5、Gemini Live等海外竞品。该模型核心突破是具备“副语言信息”处理能力，可精准识别语调、语速、停顿、叹息、轻笑等非文字信号。

80.41分

用户体验得分

中国第一

语音模型排名

副语言感知

核心能力

▸ 国产登顶：中国语音模型首次在权威评测中超越海外主流产品

▸ 情感进化：语音AI从“信息传递”向“情感传递”进化，AI陪伴场景价值重估

来源：阶跃星辰 / Artificial Analysis 2026-05-10

07 AI模型 · 蚂蚁集团

蚂蚁百灵发布万亿参数思考模型Ring-2.6-1T，支持推理强度调节

蚂蚁集团百灵大模型团队正式发布万亿参数思考模型Ring-2.6-1T，搭载可调节推理强度机制，提供high、xhigh两种模式供用户动态选择。性能数据显示，high模式PinchBench得分87.60，xhigh模式AIME26得分95.83、GPQA Diamond得分88.27，首次在“推理效能精细化运营”上展现全球竞争力。

95.83

xhigh模式AIME26得分

88.27

xhigh模式GPQA Diamond得分

双模式可调

推理强度选择

▸ 推理精细化：首次实现推理强度动态调节，用户可按场景平衡成本与效果

▸ 万亿参数：蚂蚁集团迈入万亿参数模型赛道，国产大模型阵营持续扩容

来源：蚂蚁集团 2026-05-10

08 具身智能 · 空间智能

高德ABot体系模型夺冠AGIBot全球挑战赛，空间智能实现具身化跃迁

高德地图ABot体系模型在全球AGIBot挑战赛（聚焦机器人在真实空间中的导航与操作能力）中夺得冠军，标志着空间智能从“场景理解”向“具身行动”的跃迁。此次夺冠打通了地图级空间理解能力与机器人具身行动的链路，2026年以来具身智能领域融资已超345亿元人民币，产业热度持续攀升。

冠军

AGIBot挑战赛名次

345亿

2026年具身智能融资额

空间具身跃迁

核心意义

▸ 跨界融合：地图级空间理解能力与机器人具身行动打通，新赛道诞生

▸ 资本热涌：2026年具身智能融资超345亿元，产业进入爆发期

来源：AGIBot全球挑战赛组委会 2026-05-10

09 产业政策 · 生态调整

OpenAI关闭微调API，引导开发者转向自有训练平台

OpenAI官方宣布关闭微调API服务，引导开发者转向其自有训练平台，此为继提出启发式学习（HL）新范式后的又一生态布局举措。微调API关闭后，Fireworks AI、Together.ai等竞品迅速推出替代方案，AI工具生态正在经历新一轮重组，未来AI能力提升将更多依赖外部代码生成而非模型权重微调。

微调API关闭

核心调整

生态重组

行业影响

HL范式协同

底层逻辑

▸ 生态重构：AI工具生态经历新一轮重组，开发者需适应新的模型训练范式

▸ 范式协同：关闭微调API与HL新范式高度协同，推动行业向代码生成方向转型

来源：OpenAI官方公告 2026-05-10

10 政策法规 · 监管动态

多部门密集发布AI相关政策，合规倒计时启动

5月10日多部门密集发布AI相关产业政策与监管规则：四部门联合发布《AI与能源双向赋能指导意见》，推动AI算力中心与能源系统协同优化；教育部印发《“人工智能+教育”行动计划（2026-2030）》；国家网信办宣布《AI拟人化互动服务管理办法》将于7月15日正式施行，AI陪伴类产品进入合规整改倒计时。

四部门

联合发布政策部门

7月15日

AI合规办法施行时间

规范发展

产业发展方向

▸ 合规倒计时：AI陪伴类产品需在7月15日前完成整改，否则面临下架风险

▸ 双向赋能：AI与能源协同优化，绿色算力成为新政策导向

来源：政府部门官方发布 2026-05-10

AI FRONTIER SIGNAL

每日精选全球AI重磅资讯 · 第084期