AI Paper Daily|你的Agent正在偷偷学习其他用户:AMAP-ML开源SkillClaw

AI Paper Daily ｜热门

你的Agent正在偷偷学习其他用户：AMAP-ML开源SkillClaw，让AI技能像病毒一样传播

📄 基本信息

论文：SkillClaw: Let Skills Evolve Collectively with Agentic Evolver

中文：SkillClaw：让技能通过Agentic Evolver集体进化

作者：Ziyu Ma, Shidong Yang, Yuxiang Ji 等 (8人) — AMAP-ML

发布：2026-04-09（arXiv 2604.08377）

影响力：GitHub 762 stars / 79 forks / Hugging Face 279 upvotes / Daily Papers #2

🎯 一句话总结

AMAP-ML开源的SkillClaw框架首次实现了多用户AI Agent生态中的技能集体进化——你的Agent不仅能从你自己的使用经验中学习，还能自动吸收其他用户发现的技巧和最佳实践。

🧠 核心思想

01 Agent技能的致命缺陷：部署后基本保持不变

当前LLM Agent（如OpenClaw、Hermes）依赖可复用技能执行复杂任务，但技能在部署后基本保持静态。用户A花3小时摸索出的最佳工作流，用户B/C/D需要重新摸索；相似的API调用模式、错误处理方式被反复重新发现，Agent系统无法像人类团队一样积累集体智慧。

02 三层技能孤岛困境

第一层（个人内）：多Agent间技能库完全隔离，Frontend Agent的React模式无法让Backend Agent受益。第二层（跨设备）：家里/学校/公司的Agent各学各的，无法同步。第三层（团队）：用户A调试的数据库解决方案被锁死在个人会话里，全公司每天都在重复发明轮子。

03 两层架构：Client Proxy + Evolve Server

Client Proxy是本地API代理，拦截Agent请求、记录会话产物、管理本地技能库，用户只需安装这一个组件就能开始。Evolve Server是可选的后台服务，从共享存储读取会话数据，通过Workflow引擎（3阶段LLM流水线）或Agent引擎（OpenClaw驱动）进化技能，再写回共享存储。

04 Autonomous Evolver五步法

Step 1 轨迹聚合：持续收集对话、工具调用、成功/失败结果。Step 2 模式识别：分析轨迹，识别重复行为模式。Step 3 技能更新：细化现有技能、扩展新能力、去重合并。Step 4 全局同步：更新后的技能存入共享仓库，自动同步给所有用户。Step 5 零用户负担：整个过程对用户完全透明，技能进化在后台静默发生。

05 跨框架兼容与渐进式部署

SkillClaw原生集成Hermes、OpenClaw、QwenPaw、IronClaw等10+主流Agent框架，使用标准化SKILL.md格式确保跨平台兼容。支持三种存储后端（Local/OSS/S3）和三种部署模式（个人试用/个人进化/团队共享），用户可从单机开始，逐步扩展到团队级共享。

🔬 技术方法概述

SkillClaw采用Client-Server解耦架构，Client作为本地API代理拦截/v1/chat/completions请求并记录Session Artifacts，Evolve Server异步读取共享存储中的轨迹数据执行进化。进化引擎支持两种模式：Workflow引擎使用固定3阶段LLM流水线（Summarize-Aggregate-Execute）处理轨迹并生成技能更新；Agent引擎则调用OpenClaw直接编辑SKILL.md文件。技能以标准化SKILL.md格式存储，支持Local/OSS/S3三种存储后端。Client与Server完全通过存储层异步通信，无需直接网络连接。团队可开启Validation机制：Server生成候选技能后进入待验证队列，闲置Client自动在后台测试并反馈结果，达到阈值后才正式发布，防止坏技能污染共享库。

📊 关键实验结果

SkillClaw在WildClawBench（真实世界Agent场景基准测试）上验证了多用户集体进化的有效性。在有限交互和反馈条件下，系统显著提升了Qwen3-Max在真实Agent场景中的表现。核心发现包括：单用户+自动进化可建立完整的个人级进化闭环；多用户共享组能产生协同效应，进一步提升任务成功率；即使在没有大量人工标注的有限反馈场景下，系统仍保持有效。

762

GitHub stars

279

HF upvotes

作者团队规模

💡 产品经理视角

🔹 Agent竞争从'单兵作战'进化为'群体智能'：当前Agent产品竞争焦点是模型能力，但SkillClaw揭示了新维度：生态协同能力。核心指标从'任务成功率'变为'任务成功率 x 技能进化速度'；竞争优势从'更强的模型'变为'更大的用户生态 + 更快的经验共享'；护城河从'模型参数'变为'用户行为数据资产'。

🔹 行为数据资产：被严重低估的护城河：SkillClaw证明真实用户交互数据是Agent产品最核心资产：更多用户=更多经验来源；更多经验=更快技能进化；更快进化=更好用户体验；更好体验=更多用户。这是一个正反馈循环，率先建立大规模用户生态的Agent产品将通过集体进化机制形成难以逾越的数据护城河。

🔹 Agent'网络效应'首次被技术验证：传统软件的网络效应是'越多人用越好用'。Agent产品的网络效应是'越多人用越聪明'——这不是比喻，而是SkillClaw实现的技术现实。AMAP-ML选择开源SkillClaw，可能是'以开放换标准'的高明策略，让更多Agent产品接入其生态。

🔹 产品设计的关键决策矩阵：技能共享范围（仅个人 vs 全平台）、进化触发方式（手动审核 vs 自动发布+验证）、技能格式（私有 vs 开源SKILL.md标准）、数据隐私（本地 vs 匿名化共享）。SkillClaw采用渐进式设计，从个人级开始逐步扩展到团队级，降低了用户心理门槛。

🔗 延伸阅读

1. SkillClaw: Let Skills Evolve Collectively with Agentic Evolver（Ma et al., arXiv 2026）

↳ 本文原论文，AMAP-ML团队开源

2. MetaClaw（Aiming Lab, 2025）

↳ SkillClaw的技术基础之一——Just talk to your agent, it learns and evolves

3. WildClawBench（InternLM, 2025）

↳ 本文实验使用的基准测试——真实Agent场景端到端评测

4. OpenClaw-RL（Gen-Verse, 2024）

↳ SkillClaw集成的框架之一——通过对话训练个性化Agent

AI Paper Daily ｜ 2026-04-20 ｜ by 赛博阁员张居正