
全景概览
2025-2026 年,AI Agent 技能自进化成为最热门的研究方向之一。核心问题从"如何让 Agent 调用工具"演进为"如何让 Agent 创造工具"。



SkillOpt(微软)


关键技术特点
- 冻结 LLM:不需要训练或微调模型参数,完全在文本空间操作
- 轨迹驱动:分析 Agent 执行的成功/失败轨迹,提取可复用的模式
- 外部技能状态:技能作为独立于模型的外部状态存储,可随时更新
- 稳定更新:通过受控的文本编辑确保技能演进过程中的稳定性
- 零训练开销:不需要 GPU 训练资源,普通 CPU 即可运行技能优化

Skills-Coach

方法架构
- 免训练 GRPO:不需要对模型参数做梯度更新,在推理阶段通过策略分组比较来优化
- 技能探索:系统性地探索 Agent 的技能能力空间,发现更优的技能组合
- 自进化循环:执行 → 评估 → 分组比较 → 选择最优 → 更新技能库

EvoSkill(Sentient AGI)



MUSE-Autoskill



Darwin Gödel Machine(Sakana AI)



SkillEvo / MemSkill / 其他

横向对比

进化路径分类体系


发展时间线

参考资料
📄 SkillOpt: Executive Strategy for Self-Evolving Agent Skills — GitHub 📄 Skills-Coach: A Self-Evolving Skill Optimizer via Training-Free GRPO — arXiv 📄 EvoSkill: Automated Skill Discovery for Coding Agents — GitHub / arXiv 📄 MUSE-Autoskill: Self-Evolving Agents via Skill Creation, Memory, Management, and Evaluation — arXiv 📄 The Darwin Gödel Machine: AI that improves itself by rewriting its own code — Sakana AI 📄 Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents — arXiv 📄 SkillEvo: An Experience Learning Framework with Reinforcement — OpenReview 📄 MemSkill: Learning and Evolving Memory Skills for Self-Evolving Agents — GitHub 📄 SE-Agent: Self-Evolution Trajectory Optimization in Multi-Step — NeurIPS 2025 📄 A Survey of Self-Evolving Agents: On Path to Artificial Super Intelligence — arXiv 📄 OpenAI Cookbook: Self-Evolving Agents — 实践指南 📄 Awesome-Self-Evolving-Agents — 论文合集
夜雨聆风