乐于分享
好东西不私藏

超越AMP与ADD?PDF-HR:复现宇树G1丝滑空翻!解决Sim2Real重定向中的不可行姿态问题

超越AMP与ADD?PDF-HR:复现宇树G1丝滑空翻!解决Sim2Real重定向中的不可行姿态问题

商务请联系:jszn576

读完需要

5
分钟

📄论文标题:PDF-HR: Pose Distance Fields for Humanoid Robots

🔗项目主页:https://gaoyukang33.github.io/PDF-HR/

📅发布时间: 2026年2月

    🎯核心亮点

    在缺乏大规模高质量运动数据的背景下,如何让Humanoid像人类一样自然运动?港科大(广州)与澳门大学的研究团队提出了一种即插即用的位姿距离场(PDF-HR),在宇树G1上实现了从RL训练加速到运动重定向的全面提升。🤖🕺! 
    在现有的Sim-to-Real流程中,直接将人类运动映射到机器人本体往往会引入关节超限、自碰撞或接触浮空等运动学不可行的问题 。为了解决这一痛点,来自香港科技大学(广州)和澳门大学的研究团队提出了一种名为PDF-HR (Pose Distance Fields for Humanoid Robots) 的解决方案 。这是一项关于“先验”的创新工作,不同于以往基于GAN或VAE的生成式模型,PDF-HR构建了一个连续、可微的流形距离场,能够定量评估机器人当前姿态的合理性,并为优化控制提供明确的梯度指引 。

    🧠什么是PDF-HR?

    PDF-HR的核心思想非常直观:构建一个函数,输入机器人的关节角度,输出该姿态距离“合理运动流形”的测地线距离。

    如果输出接近0,说明当前姿态非常自然、符合物理限制;如果输出值很大,说明该姿态处于异常状态(如关节扭曲、自碰撞等)。
    为了训练这个距离场,作者构建了一个基于宇树G1机器人的大规模重定向数据集。通过融合PHUMA、LaFAN1和AMASS等数据集,利用IK(逆运动学)将人类动作重定向到G1本体上,并经过筛选得到高质量的“正样本” 。

    训练过程中,团队采用了混合采样策略:

      • 🎯流形上采样: 直接使用数据集中的高质量姿态(距离为0)。
      • 🌊近流形采样: 在合理姿态附近施加扰动,学习流形附近的梯度场 。
      • 🔗插值采样: 增强全局平滑性 。
    最终得到的PDF-HR是一个轻量级的MLP网络,它不仅能判断姿态的好坏,更重要的是它是可微的。这意味着在优化控制或强化学习中,我们可以直接计算姿态相对于合理流形的梯度,从而引导策略快速收敛到可行域内 。

    🎯工程价值

    PDF-HR最大的工程价值在于其模块化和通用性。它不需要重新训练底层的控制策略,而是作为一个附加项,灵活应用于多种任务中

    场景一:强化学习运动追踪

    在基于RL的Motion Tracking任务中,探索通常是效率最低的环节。由于人形机器人的高维状态空间,Agent很容易在无效的姿态空间中“打转”。

    PDF-HR在这里充当了Reward Shaping的角色。作者引入了一个位姿先验奖励,当Agent的动作偏离合理流形时给予惩罚 。
    实验数据显示,引入PDF-HR后,训练样本效率得到了显著提升 。
      • 侧空翻这种高动态任务中,基线方法(ADD)需要消耗大量的样本探索,甚至难以收敛;而PDF-HR引导的策略能够快速锁定可行姿态,训练速度大幅领先 。
      • 猩猩跳等跑酷任务中,PDF-HR同样表现出了极强的鲁棒性 。

    场景二:运动重定向优化

    传统的运动重定向方法(如GMR)通常基于几何约束求解IK。但在缺乏物理先验的情况下,GMR容易产生违反物理规律的姿态(例如反关节或穿模),导致后续的Sim-to-Real难以部署 。
    将PDF-HR作为一个正则化项加入到IK优化目标中,可以显著修正这些伪影。实验对比显示,经PDF-HR修正后的重定向运动,不仅在视觉上更符合机器人本体结构,在物理仿真中的可追踪性也更高 。

    📉实验数据与局限性

    为了验证算法的有效性,作者在Unitree G1机器人上进行了广泛的测试,包括单轨迹追踪风格化模仿以及通用运动追踪

      • 采样效率: 在几乎所有测试任务中,PDF-HR的样本效率都优于SOTA方法(如AMP和ADD) 。

      • 真机部署: Sim-to-Real使用PDF-HR重定向的数据训练出的策略,成功在实物G1机器人上完成了舞蹈、跳跃等复杂动作,且动作连贯性明显优于基线 。

    局限性分析

    当然,作者也坦诚地指出了当前方法的不足。首先,虽然PDF-HR加速了收敛,但在某些极高精度的追踪任务中,最终的追踪误差略高于纯粹的强约束方法 。其次,在风格化生成任务中,PDF-HR偶尔会出现模式坍塌的问题,即生成的动作多样性不足 。最后,由于引入了神经网络推理,其运行速度相比于纯几何IK会稍慢,需要通过批处理优化来缓解 。

    整理不易 点点赞和关注噢~

    本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 超越AMP与ADD?PDF-HR:复现宇树G1丝滑空翻!解决Sim2Real重定向中的不可行姿态问题

    评论 抢沙发

    6 + 4 =
    • 昵称 (必填)
    • 邮箱 (必填)
    • 网址
    ×
    订阅图标按钮