AI Paper Daily | 热门
你的Agent正在偷偷学习其他用户:AMAP-ML开源SkillClaw,让AI技能像病毒一样传播
📄 基本信息
论文:SkillClaw: Let Skills Evolve Collectively with Agentic Evolver
中文:SkillClaw:让技能通过Agentic Evolver集体进化
作者:Ziyu Ma, Shidong Yang, Yuxiang Ji 等 (8人) — AMAP-ML
发布:2026-04-09(arXiv 2604.08377)
影响力:GitHub 762 stars / 79 forks / Hugging Face 279 upvotes / Daily Papers #2
🎯 一句话总结
AMAP-ML开源的SkillClaw框架首次实现了多用户AI Agent生态中的技能集体进化——你的Agent不仅能从你自己的使用经验中学习,还能自动吸收其他用户发现的技巧和最佳实践。
🧠 核心思想
01 Agent技能的致命缺陷:部署后基本保持不变
当前LLM Agent(如OpenClaw、Hermes)依赖可复用技能执行复杂任务,但技能在部署后基本保持静态。用户A花3小时摸索出的最佳工作流,用户B/C/D需要重新摸索;相似的API调用模式、错误处理方式被反复重新发现,Agent系统无法像人类团队一样积累集体智慧。
02 三层技能孤岛困境
第一层(个人内):多Agent间技能库完全隔离,Frontend Agent的React模式无法让Backend Agent受益。第二层(跨设备):家里/学校/公司的Agent各学各的,无法同步。第三层(团队):用户A调试的数据库解决方案被锁死在个人会话里,全公司每天都在重复发明轮子。
03 两层架构:Client Proxy + Evolve Server
Client Proxy是本地API代理,拦截Agent请求、记录会话产物、管理本地技能库,用户只需安装这一个组件就能开始。Evolve Server是可选的后台服务,从共享存储读取会话数据,通过Workflow引擎(3阶段LLM流水线)或Agent引擎(OpenClaw驱动)进化技能,再写回共享存储。
04 Autonomous Evolver五步法
Step 1 轨迹聚合:持续收集对话、工具调用、成功/失败结果。Step 2 模式识别:分析轨迹,识别重复行为模式。Step 3 技能更新:细化现有技能、扩展新能力、去重合并。Step 4 全局同步:更新后的技能存入共享仓库,自动同步给所有用户。Step 5 零用户负担:整个过程对用户完全透明,技能进化在后台静默发生。
05 跨框架兼容与渐进式部署
SkillClaw原生集成Hermes、OpenClaw、QwenPaw、IronClaw等10+主流Agent框架,使用标准化SKILL.md格式确保跨平台兼容。支持三种存储后端(Local/OSS/S3)和三种部署模式(个人试用/个人进化/团队共享),用户可从单机开始,逐步扩展到团队级共享。
🔬 技术方法概述
SkillClaw采用Client-Server解耦架构,Client作为本地API代理拦截/v1/chat/completions请求并记录Session Artifacts,Evolve Server异步读取共享存储中的轨迹数据执行进化。进化引擎支持两种模式:Workflow引擎使用固定3阶段LLM流水线(Summarize-Aggregate-Execute)处理轨迹并生成技能更新;Agent引擎则调用OpenClaw直接编辑SKILL.md文件。技能以标准化SKILL.md格式存储,支持Local/OSS/S3三种存储后端。Client与Server完全通过存储层异步通信,无需直接网络连接。团队可开启Validation机制:Server生成候选技能后进入待验证队列,闲置Client自动在后台测试并反馈结果,达到阈值后才正式发布,防止坏技能污染共享库。
📊 关键实验结果
SkillClaw在WildClawBench(真实世界Agent场景基准测试)上验证了多用户集体进化的有效性。在有限交互和反馈条件下,系统显著提升了Qwen3-Max在真实Agent场景中的表现。核心发现包括:单用户+自动进化可建立完整的个人级进化闭环;多用户共享组能产生协同效应,进一步提升任务成功率;即使在没有大量人工标注的有限反馈场景下,系统仍保持有效。
762
GitHub stars
279
HF upvotes
8
作者团队规模
💡 产品经理视角
🔹 Agent竞争从'单兵作战'进化为'群体智能':当前Agent产品竞争焦点是模型能力,但SkillClaw揭示了新维度:生态协同能力。核心指标从'任务成功率'变为'任务成功率 x 技能进化速度';竞争优势从'更强的模型'变为'更大的用户生态 + 更快的经验共享';护城河从'模型参数'变为'用户行为数据资产'。
🔹 行为数据资产:被严重低估的护城河:SkillClaw证明真实用户交互数据是Agent产品最核心资产:更多用户=更多经验来源;更多经验=更快技能进化;更快进化=更好用户体验;更好体验=更多用户。这是一个正反馈循环,率先建立大规模用户生态的Agent产品将通过集体进化机制形成难以逾越的数据护城河。
🔹 Agent'网络效应'首次被技术验证:传统软件的网络效应是'越多人用越好用'。Agent产品的网络效应是'越多人用越聪明'——这不是比喻,而是SkillClaw实现的技术现实。AMAP-ML选择开源SkillClaw,可能是'以开放换标准'的高明策略,让更多Agent产品接入其生态。
🔹 产品设计的关键决策矩阵:技能共享范围(仅个人 vs 全平台)、进化触发方式(手动审核 vs 自动发布+验证)、技能格式(私有 vs 开源SKILL.md标准)、数据隐私(本地 vs 匿名化共享)。SkillClaw采用渐进式设计,从个人级开始逐步扩展到团队级,降低了用户心理门槛。
🔗 延伸阅读
1. SkillClaw: Let Skills Evolve Collectively with Agentic Evolver(Ma et al., arXiv 2026)
↳ 本文原论文,AMAP-ML团队开源
2. MetaClaw(Aiming Lab, 2025)
↳ SkillClaw的技术基础之一——Just talk to your agent, it learns and evolves
3. WildClawBench(InternLM, 2025)
↳ 本文实验使用的基准测试——真实Agent场景端到端评测
4. OpenClaw-RL(Gen-Verse, 2024)
↳ SkillClaw集成的框架之一——通过对话训练个性化Agent
AI Paper Daily | 2026-04-20 | by 赛博阁员张居正
夜雨聆风