
技术进展
OpenAI研究员提出启发式学习(HL)
OpenAI核心研究员翁家翌提出一种强化学习新范式——启发式学习(HL),该范式颠覆了传统深度强化学习依赖海量数据与反向传播更新神经网络参数的路径,转而让Codex等编码智能体,在明确的目标与反馈闭环中,自主完成策略代码的编写、运行、日志分析、失败定位与迭代修改,从而将学习经验沉淀为可阅读、可测试、可审计的纯Python程序化策略。其核心优势在于实现了知识的显式化与可解释性,有效避免了神经网络的灾难性遗忘问题,并在Atari Breakout游戏中取得了864分的理论满分,开辟了一条不依赖参数优化、而是维护“持续进化的软件系统”的新工程路径。
至简动力、北大、港中文联合提出后训练范式LaST-R1
至简动力、北京大学与香港中文大学联合提出“先推理后行动”的全新后训练范式LaST-R1框架,首次将隐空间物理推理过程直接嵌入强化学习的优化回路。该框架的核心在于其“潜在推理到动作策略优化”机制,使机器人能在执行前于隐空间内对场景结构、物体关系及未来动态进行建模,环境反馈同时塑造其“如何思考”与“如何行动”。实验显示,其在LIBERO基准测试中,LaST-R1仅用1条轨迹预热便实现了99.9%的平均成功率;在真实机器人复杂操作任务上,其成功率较当前最强的SOTA模型π0.5高出22.5%,且在物体、背景、光照扰动下泛化性更优。
产品与应用动向
特斯拉发布Optimus V3人形机器人并启动量产
特斯拉正式宣布其第三代Optimus人形机器人启动量产,首批Gen-3机型已在加州弗里蒙特工厂下线并投入内部测试。该机器人身高173厘米、体重57公斤,行走速度1.2米/秒,最大负载20公斤,搭载2.3千瓦时4680电池,支持10小时连续运行与10分钟快充。其核心智能系统深度复用特斯拉FSD纯视觉AI大模型,配备HW4.0视觉芯片与12颗摄像头,可在约0.3秒内完成“感知—决策—执行”闭环,实现自主避障与精准作业。首批50台已部署于上海超级工厂,承担座椅安装、内饰装配等任务。特斯拉计划在2026年下半年面向企业客户交付,2027年投入更广泛的外部场景应用。
Hermes登顶OpenRouter全球应用Token消耗榜首
Nous Research旗下开源自进化Agent产品Hermes,登顶OpenRouter全球应用Token消耗榜首,单日消耗2710亿Token,超过此前榜首OpenClaw。该Agent主打可成长性,具备持久记忆与自主优化技能能力。其调用量前五模型中,小米MiMo-V2-Pro是第一贡献模型,Hermes Agent的累计Token消耗量已超过6.37万亿,并在OpenRouter的生产力、代码Agent等多个分类榜单中均位列第一。
百度发布文心大模型5.1
百度发布文心大模型5.1,采用“多维弹性预训练”技术,仅用业界同规模模型约6%的预训练成本,将总参数压缩至1/3、激活参数至1/2,基础效果领先。在LMArena搜索榜荣登国内第一、全球第四,4月Preview版曾登文本榜国内第一,智能体、知识、推理、深度搜索等表现突出,创意写作与Gemini 3.1 Pro相当,推理接近顶尖闭源模型,目前已在百度千帆模型广场、文心一言官网同步上线开放。
千问AI与淘宝天猫全面打通
千问与淘宝、天猫平台全面打通,实现从需求理解、商品推荐到下单、履约、售后的全流程AI购物闭环。用户现可通过千问App以自然对话方式直接浏览、对比并购买淘宝/天猫覆盖的超过40亿件商品;在淘宝App内则可使用基于千问的“AI购物助手”,体验AI试穿、AI算优惠、AI低价帮抢及一句话退换货等创新功能。该方案依托平台超20年积累的真实购物场景数据,可精准理解用户意图,提升购物决策效率。
行业融资动态
小雨智造完成数亿元B+轮融资
工业具身智能公司北京小雨智造科技有限公司完成数亿元B+轮融资,由北汽产投、复星锐正、建发出资联合投资,老股东华业天成、贵州科创天使基金跟投。公司聚焦智能焊接场景,自主研发的“Xiaoyu Brain”通用机器人大脑可统一控制不同形态机器人本体,涵盖智能感知与决策、高精度运控、动态实时闭环控制系统、模块化智能系统架构及自学习优化能力,产品已达量产交付阶段,能高精度、高鲁棒性、高泛化执行复杂焊接任务。核心团队由小米初创成员、原MIUI研发负责人乔忠良(CEO)及曾任小米软件系统平台部总经理、主导“小米大脑”开发的王文林(CTO)领衔。
容芯致远完成天使轮数亿元融资
清华系AI Infra公司北京容芯致远科技有限公司完成天使轮数亿元融资,由北京绿色能源和低碳产业基金与赛富投资基金领投,顺禧基金、富华资本等跟投。公司专注于以GPU为核心重构AI计算体系,推出AGC架构,将GPU:CPU比例提升至20:1甚至32:1,支持单一系统统一管理64个GPU,自研微秒级AI BMC及Blue Link光互连技术,实现GPU故障“热插拔”且兼容国产CPU/GPU。公司产品分为兼容PCIe标准GPU的K系列和极致性能的AGC系列,另设子品牌Upchanger布局垂直场景。
模速生态与企业
MiniMax修复Token退化问题
MiniMax发布技术报告,排查修复其M2系列模型token退化问题:根因在于分词器机制与后训练数据覆盖的深层错位,部分低频或特定领域token因生成频次过低,参数发生漂移或被挤压,导致生成能力丧失甚至跨语种混淆。团队通过对约20万词表的全量扫描,确认约4.9%的token存在显著退化。修复方案的核心是构造覆盖全词表的合成复读数据建立生成频率下限,修复后全词表输出参数稳定度提升至0.97以上,并探索混入预训练数据、定向合成低频token等方案。

夜雨聆风