OpenClaw-RL: 在使用中自适应变强的龙虾

OpenClaw-RL: 在使用中自适应变强的龙虾 | NICE158期

主题

OpenClaw-RL: 在使用中自适应变强的龙虾

时间

北京时间：2026.04.05 (周日) 09:30-10:30美东时间：2026.04.04 (周六) 21:30-22:30美西时间：2026.04.04 (周六) 18:30-19:30

直播平台

微信视频号：

b站直播间：

内容介绍

OpenClaw-RL 作为一个 RL 服务器，用户只需将个人模型部署在其上，模型便能够在 OpenClaw 的使用过程中自动持续优化。本文提出了一种结合 GRPO 和 On-policy Distillation 两者优势的优化方法，将模型与用户及环境的全部交互历史转化为 RL 训练信号。与此同时，作者还设计了有趣的实验，验证了该框架对个人 Agent 的高效优化能力。

论文信息

标题

OpenClaw-RL: Train Any Agent Simply by Talking

链接

https://arxiv.org/abs/2603.10165
https://github.com/Gen-Verse/OpenClaw-RL

嘉宾

王胤杰，芝加哥大学二年级博士生，近期在普林斯顿大学 AI Lab 实习，曾毕业于中国科学技术大学少年班学院。他的研究方向聚焦于大语言模型、智能体及其强化学习方法。开源代表作涵盖了不同应用场景的强化学习框架，包括面向智能体的 OpenClaw-RL 和 RLAnything，代码生成框架 CURE，以及扩散语言模型强化学习框架 dLLM-RL。以他为第一作者的论文发表于 NeurIPS、ICLR 等国际会议，并在 NeurIPS 2025 获得 Spotlight。

个人主页：https://yinjjiew.github.io/

主持人

华文越，微软研究院 AI Frontiers 组高级研究员。她曾在加州大学圣塔芭芭拉分校（UCSB）担任计算机科学博士后研究员，与 William Wang 教授合作。她在罗格斯大学新不伦瑞克分校（Rutgers University-New Brunswick）获得博士学位，导师是 Yongfeng Zhang 教授。她的研究重点是 LLM 智能体的安全性与效率、多智能体交互以及 LLM 推理。她入选了 2025 年 KAUST AI 新星（AI Rising Star），并在 ACL、EMNLP、ICLR、NeurIPS、TACL 等顶级自然语言处理和机器学习会议上发表了 40 多篇论文。

个人主页：https://wenyueh.github.io/

入群

欢迎加入 NICE 每周分享交流群，可与 NICEer 唠嗑，以及第一时间收到后续 NICE 分享报告的通知。加群通过小助手认证，群内无广告。

NICE介绍

NICE（Nexus for IntelligenCE）是一个由全球 50+ 位一线青年学者共同发起的顶尖 AI 前沿交流平台。成立以来，我们汇聚海内外 300+ 嘉宾，通过百余场线上深度分享与线下高规格活动（北京/上海/苏州等），全网积累超 13 万关注。目前，NICE 已构建起覆盖中、美、欧的国际化团队，正加速在硅谷、纽约、香港等地落地，致力于打造连接学术、产业与未来的全球化 AI 前沿社区。

NICE主页https://nice-nlp.github.ioNICE海外https://nice-intl.github.iob站https://space.bilibili.com/507524288Youtubehttps://www.youtube.com/@niceaitalk

编辑 | 孙俏西安交通大学