📚 精选10篇最新论文,涵盖触觉感知、运动规划、强化学习、人形机器人数据收集等前沿领域
🔥 今日亮点
触觉感知闭环数据收集引擎 | 野外人形数据收集套装RoSHI | 流匹配运动规划策略
📑 论文详情
1️⃣ TAMEn: Tactile-Aware Manipulation Engine for Closed-Loop Data Collection in Contact-Rich Tasks
关键词: 触觉感知 | 闭环数据采集 | 双手操控 | 视觉-触觉学习
核心贡献:
提出TAMEn触觉感知操控引擎,解决富接触任务中手持范式数据采集的挑战
设计跨形态可穿戴接口,支持异构夹爪快速适配,平衡追踪精度与便携性
实现双模态采集管道:精度模式(动捕高保真)和便携模式(VR野外采集+触觉可视化远程操作)
将触觉预训练、任务演示和人在回路恢复数据统一为金字塔结构数据体系
实验显示任务成功率从34%提升至75%,并开源硬件和数据集
论文链接:
https://arxiv.org/abs/2604.07335
2️⃣ RoSHI: A Versatile Robot-oriented Suit for Human Data In-the-Wild
关键词: 人形机器人 | 运动捕捉 | 野外数据采集 | IMU融合
核心贡献:
提出RoSHI混合可穿戴系统,融合低成本稀疏IMU与Project Aria眼镜
从第一人称感知中估计穿戴者完整3D姿态和体型,输出度量全局坐标系
IMU提供遮挡鲁棒性和高速运动追踪,SLAM锚定长程运动并稳定上半身姿态
在敏捷活动数据集上评估,性能优于其他第一人称基线,与SAM3D等第三人称方法相当
证明采集数据适用于真实世界人形机器人策略学习
论文链接:
https://arxiv.org/abs/2604.07331
3️⃣ Flow Motion Policy: Manipulator Motion Planning with Flow Matching Models
关键词: 运动规划 | 流匹配模型 | 端到端学习 | 多模态生成
核心贡献:
提出Flow Motion Policy,利用流匹配方法的随机生成公式捕捉规划数据内在多模态性
通过建模可行路径分布,实现推理时高效的best-of-N采样优化
生成多条端到端候选路径,规划后评估碰撞状态,执行首个无碰撞解
在采样型和神经运动规划方法基准测试中,成功率和效率均有提升
证明随机生成策略在端到端运动规划和推理时优化中的有效性
论文链接:
https://arxiv.org/abs/2604.07084
4️⃣ AEROS: A Single-Agent Operating Architecture with Embodied Capability Modules
关键词: 具身智能体 | 模块化架构 | 能力模块 | 安全策略
核心贡献:
提出AEROS架构,将机器人建模为单一持久智能体,能力通过可安装包扩展
设计具身能力模块(ECM),封装可执行技能、模型和工具,运行时强制执行安全保证
策略分离运行时实现模块化扩展、可组合能力执行和一致的系统级安全
在PyBullet仿真和Franka Panda上评估,100%任务成功率(基线67-93%)
策略层零误接受地阻止所有无效动作,支持ECM运行时热插拔
论文链接:
https://arxiv.org/abs/2604.07039
5️⃣ Robust Quadruped Locomotion via Evolutionary Reinforcement Learning
关键词: 四足机器人 | 进化强化学习 | 策略迁移 | 鲁棒性
核心贡献:
结合梯度策略优化与群体驱动探索的进化强化学习方法
评估DDPG、TD3及两种交叉熵变体(CEM-DDPG、CEM-TD3)在模拟行走任务上
TD3在平地上表现最佳(5927.26),CEM-TD3在训练和评估中总体奖励最高(17611.41)
粗糙地形迁移测试中,深度RL方法性能骤降,而进化变体保持能力
CEM-TD3在迁移测试中记录最强性能(19574.33),证明进化搜索可减少过拟合
论文链接:
https://arxiv.org/abs/2604.07224
6️⃣ BiDexGrasp: Coordinated Bimanual Dexterous Grasps across Object Geometries and Sizes
关键词: 双手抓取 | 灵巧手 | 数据集构建 | 生成模型
核心贡献:
构建大规模双手灵巧抓取数据集,包含6351个多样物体(30-80cm)和970万标注抓取
提出两阶段合成策略:基于区域的抓取初始化和解耦力闭合抓取优化
设计双手协调模块和几何-尺寸自适应抓取生成策略
生成框架对未见物体生成协调高质量抓取,在模拟和真实世界验证
项目页面提供完整数据资源和代码
论文链接:
https://arxiv.org/abs/2604.06589
7️⃣ Reason in Chains, Learn in Trees: Self-Rectification and Grafting for Multi-turn Agent Policy Optimization
关键词: LLM智能体 | 强化学习 | 认知树 | 策略优化
核心贡献:
提出T-STAR框架,解决多步推理任务中稀疏奖励的信用分配问题
将轨迹整合为统一认知树,识别并合并功能相似步骤/节点
内省评估机制通过树反向传播轨迹级奖励,获得方差缩减的步骤级优势
上下文思维嫁接对比成功与失败分支在关键分歧点合成纠正推理
手术式策略优化利用Bradley-Terry损失聚焦关键步骤,在具身、推理基准上取得提升
论文链接:
https://arxiv.org/abs/2604.07165
8️⃣ Differentiable Environment-Trajectory Co-Optimization for Safe Multi-Agent Navigation
关键词: 多智能体导航 | 双层优化 | 可微规划 | 环境设计
核心贡献:
将环境配置与智能体动作同时作为决策变量,联合实现安全导航
构建双层问题:下层优化轨迹最小化导航成本,上层优化环境配置最大化安全性
利用KKT条件和隐函数定理计算轨迹对环境参数的梯度,实现双层结构可微
提出基于测度理论的新指标量化导航安全性作为上层优化准则
在仓库物流到城市交通场景中验证,优化环境提供导航引导,提升安全性和效率
论文链接:
https://arxiv.org/abs/2604.06972
9️⃣ RichMap: A Reachability Map Balancing Precision, Efficiency, and Flexibility for Rich Robot Manipulation Tasks
关键词: 可达性图 | 机器人操控 | 扩散策略 | 跨形态迁移
核心贡献:
提出RichMap高精度可达性图表示,平衡效率与灵活性
利用S²(或SO(3))理论容量界限确保严格覆盖,采用异步管道高效构建
实现>98%预测准确率、1-2%误报率、~15μs/查询的大批量查询速度
扩展应用:通过MMD度量量化机器人工作空间相似性
在块推动实验中,基于能量的扩散策略迁移指导实现跨形态场景26%的提升
论文链接:
https://arxiv.org/abs/2604.06778
🔟 Train-Small Deploy-Large: Leveraging Diffusion-Based Multi-Robot Planning
关键词: 多机器人规划 | 扩散模型 | 小训练大部署 | 智能体数量泛化
核心贡献:
提出扩散模型规划器,处理动态变化的智能体数量,实现"小训练大部署"范式
单一共享扩散模型结合专用智能体间注意力计算和时间卷积
在有限数量智能体上训练,部署时有效泛化到更大数量
解决现有方法对训练时固定数量智能体的依赖,提升变化环境的适应性
在多种场景验证,与多智能体强化学习和启发式控制方法对比
论文链接:
https://arxiv.org/abs/2604.06598
📊 今日趋势
| 研究方向 | 论文数量 | 热度 |
|---|---|---|
| 🤖 机器人操控/抓取 | 4篇 | 🔥🔥🔥 |
| 🧠 智能体架构/规划 | 3篇 | 🔥🔥🔥 |
| 🎮 强化学习/运动控制 | 2篇 | 🔥🔥 |
| 📊 数据收集/数据集 | 2篇 | 🔥🔥 |
| 🦾 多机器人系统 | 1篇 | 🔥🔥 |
💡 核心洞察
触觉感知与闭环数据收集成为新焦点:TAMEn展示了触觉预训练、任务演示和人在回路恢复数据的统一框架,将视觉-触觉学习应用于双手操控任务成功率提升显著,触觉感知正成为机器人精细操作的关键能力
野外人形数据采集方案多样化:RoSHI通过IMU与AR眼镜的混合方案解决野外人体姿态估计问题,为规模化人形机器人策略学习提供数据基础,显示人形机器人数据收集正从实验室走向真实场景
生成模型在运动规划中展现潜力:流匹配和扩散模型被应用于运动规划(BiDexGrasp、Flow Motion Policy、Train-Small Deploy-Large),展现出在捕捉多模态分布和跨形态泛化方面的独特优势
智能体架构向模块化、安全化发展:AEROS提出具身能力模块(ECM)和策略分离运行时,实现模块化扩展与系统级安全,反映具身智能体架构正从端到端向结构化、可解释方向演进
夜雨聆风