AI前沿速递·5月10日|Agent爆发·新范式·文心5.1
Hermes登顶·OpenAI新范式·文心5.1·DS融资·阶跃语音·蚂蚁Ring·高德ABot
5月10日AI Agent与多模态能力双重爆发:Hermes Agent以单日2710亿Token消耗登顶OpenRouter全球调用榜,国产开源模型成为Agent时代核心基础设施。同期OpenAI提出无需参数更新的强化学习新范式,谷歌DeepMind发布「AI联合数学家」系统刷新数学基准,百度文心5.1以仅业界6%的预训练成本登顶国内搜索榜,阶跃星辰语音模型登顶国产第一,蚂蚁百灵发布万亿参数Ring-2.6-1T,高德ABot夺冠全球具身智能挑战赛。DeepSeek500亿融资推进、V4.1定档6月,OpenAI关闭微调API引导生态重组,AI政策合规进入倒计时——AI从技术突破向规模化落地加速演进。
Hermes Agent登顶OpenRouter全球调用榜,国产模型成Agent核心基础设施
Nous Research旗下Hermes Agent单日Token消耗量达2710亿,首次超越OpenClaw登顶OpenRouter全球调用榜首,累计消耗超6.37万亿Token。小米MiMo是Hermes Agent调用量最高的底层模型,标志着国产开源模型已成长为全球Agent应用落地的关键基础设施。此次登顶验证了Agent应用从“技术展示”向“真实规模化消耗”的关键跃迁。
▸ 规模验证:Agent应用从展示走向真实规模化消耗,Token成本成核心竞争力
▸ 国产崛起:国产开源模型首次成为海外头部Agent应用的核心底座
来源:OpenRouter / Nous Research 2026-05-10
OpenAI研究员翁家翌提出名为“启发式学习(HL)”的强化学习新范式,AI无需更新模型权重,仅需编写可执行代码(.py文件)即可完成决策优化。在Atari Breakout测试中,该范式达到864分(接近理论满分),且完全不需要神经网络训练。这一研究将“模型权重”与“行为策略”解耦,是强化学习领域的革命性突破。
▸ 范式革命:将模型权重与行为策略解耦,未来AI能力提升依赖代码生成而非权重更新
▸ 零训练成本:无需神经网络训练即可达到顶级游戏AI水平
谷歌DeepMind发布「AI联合数学家」系统,刷新数学推理基准SOTA
谷歌DeepMind正式发布可与数学家协同工作的AI研究助手「AI联合数学家」,在FrontierMath Tier 4高难度数学基准测试中准确率达48%,刷新当前SOTA。该系统采用异步有状态工作空间设计,通过Agentic编排实现能力跃升,已协助牛津大学数学家解决了群论领域悬置几十年的第21.10号问题。
▸ 科研落地:AI在基础科研领域的应用进入实用阶段,可协助解决数十年未解的数学难题
百度文心大模型5.1发布,预训练成本仅业界6%登顶国内搜索榜
百度正式发布新一代文心大模型5.1,采用“多维弹性预训练”技术,参数规模压缩至文心5.0的约1/3,预训练成本仅为业界同规模模型的6%。该模型已在LMSYS LMArena搜索榜以1223分登顶国内第一、全球第四,同步上线百度千帆模型广场和文心一言官网,面向企业用户和开发者开放体验。
▸ 成本突破:预训练成本仅为业界同规模模型6%,打破“大模型必烧钱”认知
▸ 性能登顶:国内搜索榜第一,全球第四,国产大模型性价比领跑
DeepSeek推进500亿融资、V4.1定档6月,新增多模态能力
国内AI大模型头部企业DeepSeek首轮融资推进顺利,目标规模最高达500亿元人民币(约73.5亿美元),若成功将创中国AI公司单轮融资最高纪录,创始人梁文锋个人出资200亿元占比40%,国家集成电路产业投资基金洽谈领投。同期官方确认DeepSeek-V4.1定档2026年6月发布,将新增图像与音频多模态理解能力。
▸ 融资纪录:若成功将创中国AI公司单轮融资最高纪录,国家队入场加持
▸ 多模态升级:V4.1新增图像与音频多模态能力,进一步缩小与海外模型差距
来源:投资圈消息 / DeepSeek官方 2026-05-10
阶跃星辰StepAudio 2.5 Realtime登顶国产语音模型第一
阶跃星辰新一代实时语音大模型StepAudio 2.5 Realtime在全球权威语音评测榜单Artificial Analysis Speech Arena中位列中国语音模型第一,用户体验得分80.41,超越GPT-Realtime-1.5、Gemini Live等海外竞品。该模型核心突破是具备“副语言信息”处理能力,可精准识别语调、语速、停顿、叹息、轻笑等非文字信号。
▸ 国产登顶:中国语音模型首次在权威评测中超越海外主流产品
▸ 情感进化:语音AI从“信息传递”向“情感传递”进化,AI陪伴场景价值重估
来源:阶跃星辰 / Artificial Analysis 2026-05-10
蚂蚁百灵发布万亿参数思考模型Ring-2.6-1T,支持推理强度调节
蚂蚁集团百灵大模型团队正式发布万亿参数思考模型Ring-2.6-1T,搭载可调节推理强度机制,提供high、xhigh两种模式供用户动态选择。性能数据显示,high模式PinchBench得分87.60,xhigh模式AIME26得分95.83、GPQA Diamond得分88.27,首次在“推理效能精细化运营”上展现全球竞争力。
▸ 推理精细化:首次实现推理强度动态调节,用户可按场景平衡成本与效果
▸ 万亿参数:蚂蚁集团迈入万亿参数模型赛道,国产大模型阵营持续扩容
高德ABot体系模型夺冠AGIBot全球挑战赛,空间智能实现具身化跃迁
高德地图ABot体系模型在全球AGIBot挑战赛(聚焦机器人在真实空间中的导航与操作能力)中夺得冠军,标志着空间智能从“场景理解”向“具身行动”的跃迁。此次夺冠打通了地图级空间理解能力与机器人具身行动的链路,2026年以来具身智能领域融资已超345亿元人民币,产业热度持续攀升。
▸ 跨界融合:地图级空间理解能力与机器人具身行动打通,新赛道诞生
▸ 资本热涌:2026年具身智能融资超345亿元,产业进入爆发期
来源:AGIBot全球挑战赛组委会 2026-05-10
OpenAI关闭微调API,引导开发者转向自有训练平台
OpenAI官方宣布关闭微调API服务,引导开发者转向其自有训练平台,此为继提出启发式学习(HL)新范式后的又一生态布局举措。微调API关闭后,Fireworks AI、Together.ai等竞品迅速推出替代方案,AI工具生态正在经历新一轮重组,未来AI能力提升将更多依赖外部代码生成而非模型权重微调。
▸ 生态重构:AI工具生态经历新一轮重组,开发者需适应新的模型训练范式
▸ 范式协同:关闭微调API与HL新范式高度协同,推动行业向代码生成方向转型
5月10日多部门密集发布AI相关产业政策与监管规则:四部门联合发布《AI与能源双向赋能指导意见》,推动AI算力中心与能源系统协同优化;教育部印发《“人工智能+教育”行动计划(2026-2030)》;国家网信办宣布《AI拟人化互动服务管理办法》将于7月15日正式施行,AI陪伴类产品进入合规整改倒计时。
▸ 合规倒计时:AI陪伴类产品需在7月15日前完成整改,否则面临下架风险
▸ 双向赋能:AI与能源协同优化,绿色算力成为新政策导向
© 2026 Frontier Signal. All rights reserved.