主题
OpenClaw-RL: 在使用中自适应变强的龙虾
时间
北京时间:2026.04.05 (周日) 09:30-10:30美东时间:2026.04.04 (周六) 21:30-22:30美西时间:2026.04.04 (周六) 18:30-19:30
直播平台
微信视频号:
b站直播间:


内容介绍
OpenClaw-RL 作为一个 RL 服务器,用户只需将个人模型部署在其上,模型便能够在 OpenClaw 的使用过程中自动持续优化。
本文提出了一种结合 GRPO 和 On-policy Distillation 两者优势的优化方法,将模型与用户及环境的全部交互历史转化为 RL 训练信号。与此同时,作者还设计了有趣的实验,验证了该框架对个人 Agent 的高效优化能力。
论文信息
标题 OpenClaw-RL: Train Any Agent Simply by Talking 链接 https://arxiv.org/abs/2603.10165 https://github.com/Gen-Verse/OpenClaw-RL
嘉宾
王胤杰,芝加哥大学二年级博士生,近期在普林斯顿大学 AI Lab 实习,曾毕业于中国科学技术大学少年班学院。他的研究方向聚焦于大语言模型、智能体及其强化学习方法。开源代表作涵盖了不同应用场景的强化学习框架,包括面向智能体的 OpenClaw-RL 和 RLAnything,代码生成框架 CURE,以及扩散语言模型强化学习框架 dLLM-RL。以他为第一作者的论文发表于 NeurIPS、ICLR 等国际会议,并在 NeurIPS 2025 获得 Spotlight。
个人主页:https://yinjjiew.github.io/
主持人
华文越,微软研究院 AI Frontiers 组高级研究员。她曾在加州大学圣塔芭芭拉分校(UCSB)担任计算机科学博士后研究员,与 William Wang 教授合作。她在罗格斯大学新不伦瑞克分校(Rutgers University-New Brunswick)获得博士学位,导师是 Yongfeng Zhang 教授。她的研究重点是 LLM 智能体的安全性与效率、多智能体交互以及 LLM 推理。她入选了 2025 年 KAUST AI 新星(AI Rising Star),并在 ACL、EMNLP、ICLR、NeurIPS、TACL 等顶级自然语言处理和机器学习会议上发表了 40 多篇论文。
个人主页:https://wenyueh.github.io/
入群
欢迎加入 NICE 每周分享交流群,可与 NICEer 唠嗑,以及第一时间收到后续 NICE 分享报告的通知。加群通过小助手认证,群内无广告。

NICE介绍
NICE(Nexus for IntelligenCE)是一个由全球 50+ 位一线青年学者共同发起的顶尖 AI 前沿交流平台。 成立以来,我们汇聚海内外 300+ 嘉宾,通过百余场线上深度分享与线下高规格活动(北京/上海/苏州等),全网积累超 13 万关注。目前,NICE 已构建起覆盖中、美、欧的国际化团队,正加速在硅谷、纽约、香港等地落地,致力于打造连接学术、产业与未来的全球化 AI 前沿社区。
NICE主页https://nice-nlp.github.ioNICE海外https://nice-intl.github.iob站https://space.bilibili.com/507524288Youtubehttps://www.youtube.com/@niceaitalk
编辑 | 孙俏 西安交通大学
夜雨聆风