�� AI具身智能日报

�� AI具身智能日报 | 2026年4月9日

📚 精选10篇最新论文，涵盖触觉感知、运动规划、强化学习、人形机器人数据收集等前沿领域

🔥 今日亮点

触觉感知闭环数据收集引擎 | 野外人形数据收集套装RoSHI | 流匹配运动规划策略

📑 论文详情

1️⃣ TAMEn: Tactile-Aware Manipulation Engine for Closed-Loop Data Collection in Contact-Rich Tasks

关键词: 触觉感知 | 闭环数据采集 | 双手操控 | 视觉-触觉学习

核心贡献:

提出TAMEn触觉感知操控引擎，解决富接触任务中手持范式数据采集的挑战
设计跨形态可穿戴接口，支持异构夹爪快速适配，平衡追踪精度与便携性
实现双模态采集管道：精度模式（动捕高保真）和便携模式（VR野外采集+触觉可视化远程操作）
将触觉预训练、任务演示和人在回路恢复数据统一为金字塔结构数据体系
实验显示任务成功率从34%提升至75%，并开源硬件和数据集

论文链接:

https://arxiv.org/abs/2604.07335

2️⃣ RoSHI: A Versatile Robot-oriented Suit for Human Data In-the-Wild

关键词: 人形机器人 | 运动捕捉 | 野外数据采集 | IMU融合

核心贡献:

提出RoSHI混合可穿戴系统，融合低成本稀疏IMU与Project Aria眼镜
从第一人称感知中估计穿戴者完整3D姿态和体型，输出度量全局坐标系
IMU提供遮挡鲁棒性和高速运动追踪，SLAM锚定长程运动并稳定上半身姿态
在敏捷活动数据集上评估，性能优于其他第一人称基线，与SAM3D等第三人称方法相当
证明采集数据适用于真实世界人形机器人策略学习

论文链接:

https://arxiv.org/abs/2604.07331

3️⃣ Flow Motion Policy: Manipulator Motion Planning with Flow Matching Models

关键词: 运动规划 | 流匹配模型 | 端到端学习 | 多模态生成

核心贡献:

提出Flow Motion Policy，利用流匹配方法的随机生成公式捕捉规划数据内在多模态性
通过建模可行路径分布，实现推理时高效的best-of-N采样优化
生成多条端到端候选路径，规划后评估碰撞状态，执行首个无碰撞解
在采样型和神经运动规划方法基准测试中，成功率和效率均有提升
证明随机生成策略在端到端运动规划和推理时优化中的有效性

论文链接:

https://arxiv.org/abs/2604.07084

4️⃣ AEROS: A Single-Agent Operating Architecture with Embodied Capability Modules

关键词: 具身智能体 | 模块化架构 | 能力模块 | 安全策略

核心贡献:

提出AEROS架构，将机器人建模为单一持久智能体，能力通过可安装包扩展
设计具身能力模块(ECM)，封装可执行技能、模型和工具，运行时强制执行安全保证
策略分离运行时实现模块化扩展、可组合能力执行和一致的系统级安全
在PyBullet仿真和Franka Panda上评估，100%任务成功率（基线67-93%）
策略层零误接受地阻止所有无效动作，支持ECM运行时热插拔

论文链接:

https://arxiv.org/abs/2604.07039

5️⃣ Robust Quadruped Locomotion via Evolutionary Reinforcement Learning

关键词: 四足机器人 | 进化强化学习 | 策略迁移 | 鲁棒性

核心贡献:

结合梯度策略优化与群体驱动探索的进化强化学习方法
评估DDPG、TD3及两种交叉熵变体(CEM-DDPG、CEM-TD3)在模拟行走任务上
TD3在平地上表现最佳(5927.26)，CEM-TD3在训练和评估中总体奖励最高(17611.41)
粗糙地形迁移测试中，深度RL方法性能骤降，而进化变体保持能力
CEM-TD3在迁移测试中记录最强性能(19574.33)，证明进化搜索可减少过拟合

论文链接:

https://arxiv.org/abs/2604.07224

6️⃣ BiDexGrasp: Coordinated Bimanual Dexterous Grasps across Object Geometries and Sizes

关键词: 双手抓取 | 灵巧手 | 数据集构建 | 生成模型

核心贡献:

构建大规模双手灵巧抓取数据集，包含6351个多样物体(30-80cm)和970万标注抓取
提出两阶段合成策略：基于区域的抓取初始化和解耦力闭合抓取优化
设计双手协调模块和几何-尺寸自适应抓取生成策略
生成框架对未见物体生成协调高质量抓取，在模拟和真实世界验证
项目页面提供完整数据资源和代码

论文链接:

https://arxiv.org/abs/2604.06589

7️⃣ Reason in Chains, Learn in Trees: Self-Rectification and Grafting for Multi-turn Agent Policy Optimization

关键词: LLM智能体 | 强化学习 | 认知树 | 策略优化

核心贡献:

提出T-STAR框架，解决多步推理任务中稀疏奖励的信用分配问题
将轨迹整合为统一认知树，识别并合并功能相似步骤/节点
内省评估机制通过树反向传播轨迹级奖励，获得方差缩减的步骤级优势
上下文思维嫁接对比成功与失败分支在关键分歧点合成纠正推理
手术式策略优化利用Bradley-Terry损失聚焦关键步骤，在具身、推理基准上取得提升

论文链接:

https://arxiv.org/abs/2604.07165

8️⃣ Differentiable Environment-Trajectory Co-Optimization for Safe Multi-Agent Navigation

关键词: 多智能体导航 | 双层优化 | 可微规划 | 环境设计

核心贡献:

将环境配置与智能体动作同时作为决策变量，联合实现安全导航
构建双层问题：下层优化轨迹最小化导航成本，上层优化环境配置最大化安全性
利用KKT条件和隐函数定理计算轨迹对环境参数的梯度，实现双层结构可微
提出基于测度理论的新指标量化导航安全性作为上层优化准则
在仓库物流到城市交通场景中验证，优化环境提供导航引导，提升安全性和效率

论文链接:

https://arxiv.org/abs/2604.06972

9️⃣ RichMap: A Reachability Map Balancing Precision, Efficiency, and Flexibility for Rich Robot Manipulation Tasks

关键词: 可达性图 | 机器人操控 | 扩散策略 | 跨形态迁移

核心贡献:

提出RichMap高精度可达性图表示，平衡效率与灵活性
利用S²(或SO(3))理论容量界限确保严格覆盖，采用异步管道高效构建
实现>98%预测准确率、1-2%误报率、~15μs/查询的大批量查询速度
扩展应用：通过MMD度量量化机器人工作空间相似性
在块推动实验中，基于能量的扩散策略迁移指导实现跨形态场景26%的提升

论文链接:

https://arxiv.org/abs/2604.06778

🔟 Train-Small Deploy-Large: Leveraging Diffusion-Based Multi-Robot Planning

关键词: 多机器人规划 | 扩散模型 | 小训练大部署 | 智能体数量泛化

核心贡献:

提出扩散模型规划器，处理动态变化的智能体数量，实现"小训练大部署"范式
单一共享扩散模型结合专用智能体间注意力计算和时间卷积
在有限数量智能体上训练，部署时有效泛化到更大数量
解决现有方法对训练时固定数量智能体的依赖，提升变化环境的适应性
在多种场景验证，与多智能体强化学习和启发式控制方法对比

论文链接:

https://arxiv.org/abs/2604.06598

📊 今日趋势

研究方向	论文数量	热度
🤖 机器人操控/抓取	4篇	🔥🔥🔥
🧠 智能体架构/规划	3篇	🔥🔥🔥
🎮 强化学习/运动控制	2篇	🔥🔥
📊 数据收集/数据集	2篇	🔥🔥
🦾 多机器人系统	1篇	🔥🔥

💡 核心洞察

触觉感知与闭环数据收集成为新焦点：TAMEn展示了触觉预训练、任务演示和人在回路恢复数据的统一框架，将视觉-触觉学习应用于双手操控任务成功率提升显著，触觉感知正成为机器人精细操作的关键能力
野外人形数据采集方案多样化：RoSHI通过IMU与AR眼镜的混合方案解决野外人体姿态估计问题，为规模化人形机器人策略学习提供数据基础，显示人形机器人数据收集正从实验室走向真实场景
生成模型在运动规划中展现潜力：流匹配和扩散模型被应用于运动规划(BiDexGrasp、Flow Motion Policy、Train-Small Deploy-Large)，展现出在捕捉多模态分布和跨形态泛化方面的独特优势
智能体架构向模块化、安全化发展：AEROS提出具身能力模块(ECM)和策略分离运行时，实现模块化扩展与系统级安全，反映具身智能体架构正从端到端向结构化、可解释方向演进