OpenClaw,Hermes-Agent,Goose,继养虾养马之后开始养鹅了,github 49.5k Star
1.1 背景介绍
Goose 是由 GooseAI Agents 团队开发的一个可扩展、开箱即用的 AI Agent 开发框架,旨在让开发者能够快速构建、部署和管理生产级别的 AI Agent 应用。Goose 的设计理念强调模块化、可组合性以及对现实世界复杂任务的适配能力,不只是一个实验室原型,而是一个面向生产的完整解决方案。
Goose 的诞生背景:
-
2023—2024 年间,大语言模型(LLM)能力大幅跃升,行业对「Agent」的需求从概念验证走向生产落地。 -
当时的 Agent 框架(如 LangChain、AutoGPT 等)要么过于底层、学习曲线陡峭,要么过于简陋、无法处理复杂任务流。 -
Goose 试图在这两者之间找到平衡:提供足够灵活的扩展机制,同时通过** Opinionated 的默认配置**让开发者能快速上手。
1.2 技术架构
Goose 采用分层模块化架构,核心组件包括:
┌─────────────────────────────────────────┐│ Agent Core ││ (规划、推理、记忆、工具调用) │├──────────┬──────────┬──────────────────┤│ Memory │ Planning │ Tool System ││ 记忆模块 │ 规划模块 │ 工具系统 │├──────────┴──────────┴──────────────────┤│ Provider Abstraction Layer ││ (LLM Provider 抽象层) │├─────────────────────────────────────────┤│ LLM Providers: OpenAI / Anthropic / ││ Azure / Ollama / Gemini / Cohere ... │└─────────────────────────────────────────┘
核心模块详解:
|
|
|
|
|---|---|---|
| Agent Core |
|
|
| Memory |
|
|
| Planning |
|
|
| Tool System |
|
|
| Provider Abstraction |
|
|
1.3 核心特点与创新点
- 多 Provider 无缝切换
:通过抽象层,开发者可以在不修改业务逻辑的情况下更换底层模型(OpenAI ↔ Anthropic ↔ 本地 Ollama)。 - Structured Output 原生支持
:内置 Pydantic 模式校验,确保 Agent 输出结构化、可预期,降低下游解析成本。 - Tool Versioning & 安全
:工具注册到版本化注册表,每个工具可设置权限范围(白名单/黑名单),防止 Agent 误调用危险操作。 - 内置监控与可观测性
:提供 Token 使用量追踪、调用延迟监控、Agent 决策路径回放等生产级能力。 - 异步并发执行
:基于 asyncio 构建,支持多个工具/子任务并发执行,提升吞吐量。 - 会话快照与恢复
:支持将复杂会话状态序列化保存,断点续传,适合长时任务。
1.4 适用场景
-
需要对接多个 LLM Provider 的企业级应用 -
复杂多步骤自动化流程(RPA+AI 混合场景) -
需要对 Agent 行为进行精细审计与回放的生产系统
二、OpenClaw
2.1 背景介绍
OpenClaw 是由 Rootly 团队开源的 AI Agent 框架,其核心理念是 “Agent as a Service”(Agent 即服务)。OpenClaw 脱胎于 Rootly 自身的 SRE(Site Reliability Engineering)自动化场景,专注于用 AI Agent 自动化处理生产环境告警、事件响应、运维操作等高风险任务。
OpenClaw 的差异化定位:
- 运维/事件响应垂直场景
,而非通用 Agent 框架。 -
强调 Human-in-the-Loop(人在回路)——所有危险操作必须人工确认才能执行。 -
强调 可审计性——每一次 Agent 行为都有完整的操作日志和变更记录。
2.2 技术架构
┌──────────────────────────────────────────────┐│ OpenClaw Agent ││ (事件触发 → 诊断 → 修复建议 / 自动修复) │├──────────────────────────────────────────────┤│ Tool Registry │ Executor │ Audit Logger │├──────────────────────────────────────────────┤│ Incident Management Integration ││ (PagerDuty, Opsgenie, Jira, Slack ...) │├──────────────────────────────────────────────┤│ LLM: GPT-4 / Claude / Gemini │└──────────────────────────────────────────────┘
与通用框架的显著区别:OpenClaw 的工具系统深度集成 Incident Management 生态(PagerDuty、Opsgenie),Agent 不仅能分析告警,还能直接创建工单、发送 Slack 通知、更新值班记录。
2.3 核心特点与创新点
- 事件驱动架构
:Agent 由告警/事件自动触发,而非被动等待用户指令。 - Safety Gates(安全门)
:高危操作(如重启服务、删除资源)必须经过多级审批流程,Agent 只能提出修复建议,不能直接执行。 - Playbook 驱动的执行
:运维团队预先定义 Runbook(操作手册),Agent 在 Playbook 约束范围内行动,既保证效率又确保安全。 - 深度可观测性集成
:原生对接 Datadog、Prometheus、Grafana 等监控工具,Agent 诊断过程透明可查。 - 多租户与权限隔离
:适合大型企业 SRE 团队使用,不同团队的 Agent 互相隔离。
2.4 适用场景
-
SRE 团队:自动化告警分类、根因分析、修复建议生成 -
DevOps 流水线:自动化环境检查、部署验证、故障恢复 -
企业 ITSM:工单自动处理、知识库问答
三、Hermes-Agent
3.1 背景介绍
Hermes-Agent 由 NousResearch 团队开发,是一个自改进(Self-Improving)的 Agent 框架。与传统 Agent 框架不同,Hermes-Agent 强调 Agent 在执行任务过程中能够从失败中学习、自我优化决策策略,而不需要人工干预更新提示词或工作流。
Hermes 的研究背景:
-
NousResearch 是较早探索 LLM Agent 自我改进能力的团队之一。 -
核心论文和实验围绕「Agent 如何通过环境反馈自主优化」展开。 -
目标是让 Agent 从「按固定提示词执行」进化为「能根据历史表现调整策略」。
3.2 技术架构
┌──────────────────────────────────────────────┐│ Hermes-Agent Core ││ Self-Evolution Loop: ││ 执行 → 评估 → 策略更新 → 再执行 │├──────────────────────────────────────────────┤│ Experience Buffer │ Strategy Optimizer ││ 经验缓冲区 │ 策略优化器 │├──────────────────────────────────────────────┤│ Tool-use LLM │ Critic Model (可选) │├──────────────────────────────────────────────┤│ Environment Feedback / RL Signal │└──────────────────────────────────────────────┘
自改进机制详解:
Hermes 的核心是一个闭环学习系统:
- Experience Buffer
:存储 Agent 在历史任务中的成功/失败案例、工具使用效果、决策路径。 - Critic Model(可选)
:用一个小模型评估当前决策的质量,生成内部奖励信号。 - Strategy Update
:基于历史经验调整 Agent 的决策偏好(如优先使用哪些工具、如何分解任务)。 - 上线新策略 → 再次执行 → 观察效果 → 持续迭代
。
3.3 核心特点与创新点
- 自改进闭环
:无需人工干预,Agent 能从历史错误中学习并更新自身行为模式。 - 经验回放机制
:类似强化学习中的 Experience Replay,Agent 可以从历史成功案例中复用策略。 - Critic Model 双模型架构
:用独立的小模型评估主模型的决策质量,成本低于让大模型自我反思。 - Flexible Tool Use
:工具调用无硬编码,Agent 根据任务动态选择和组合工具。 - Memory-Enhanced Planning
:结合外部记忆模块,支持跨会话学习。
3.4 适用场景
-
需要 Agent 长期运行并持续优化自身表现的场景 -
动态环境中的自适应任务(如自动化的测试生成与修复) -
研究型场景:探索 LLM Agent 的自我改进边界
四、三框架横向对比
4.1 基本信息对比
|
|
Goose | OpenClaw | Hermes-Agent |
|---|---|---|---|
| 开发团队 |
|
|
|
| 开源时间 |
|
|
|
| GitHub 星标 |
|
|
|
| 核心定位 |
|
|
|
| 编程语言 |
|
|
|
| 主要用户 |
|
|
|
4.2 架构设计对比
|
|
Goose | OpenClaw | Hermes-Agent |
|---|---|---|---|
| 架构模式 |
|
|
|
| LLM 抽象 |
|
|
|
| 工具系统 |
|
|
|
| 记忆机制 |
|
|
|
| 执行模型 |
|
|
|
4.3 核心能力对比
|
|
Goose | OpenClaw | Hermes-Agent |
|---|---|---|---|
| 多 Provider 支持 |
|
|
|
| Safety / 权限控制 |
|
|
|
| Human-in-the-Loop |
|
|
|
| 自改进 / 自我优化 |
|
|
|
| 生产可观测性 |
|
|
|
| 会话快照 / 断点恢复 |
|
|
|
| 异步并发执行 |
|
|
|
| 多租户 / 团队隔离 |
|
|
|
4.4 优劣势总结
Goose
-
✅ 优势:最通用、最灵活;多 Provider 支持好;生产功能完善(监控、断点恢复);上手难度中等。 -
❌ 劣势:自改进能力缺失;垂直场景深度不足;工具系统虽完善但需要较多配置。
OpenClaw
-
✅ 优势:垂直场景深度极强(SRE/运维);Safety Gate 设计严谨;可观测性优秀;多租户支持好。 -
❌ 劣势:场景过于垂直,不适合通用 Agent 场景;Playbook 约束降低了灵活性;Agent 无法自主执行高危操作。
Hermes-Agent
-
✅ 优势:自改进机制独树一帜;适合长期运行的自适应 Agent;技术理念前沿。 -
❌ 劣势:成熟度相对较低;生产功能(监控、安全)不完善;Critic Model 增加了资源消耗和延迟;不适合需要严格确定性行为的场景。
4.5 选型建议
|
|
|
|---|---|
|
|
Goose |
|
|
OpenClaw |
|
|
Hermes-Agent |
|
|
OpenClaw |
|
|
Hermes-Agent |
|
|
Goose |
五、技术趋势与总结
5.1 共同趋势
- 多 Provider 抽象成为标配
:随着模型提供商多元化,框架层对 LLM 接口的统一抽象越来越重要。 - 安全与可控性被提升到核心地位
:OpenClaw 的 Safety Gate 理念正在被更多框架借鉴。 - 记忆与经验管理日趋成熟
:从简单会话历史到向量检索 + 经验回放,Agent 的「记忆」能力在快速进化。 - 自改进能力从研究走向落地
:Hermes 代表的方向值得关注,但距离大规模生产应用仍需时间。
参考:
Goose GitHub: https://github.com/goose-ai-agents/goose
OpenClaw GitHub: https://github.com/rootlyhq/openclaw
Hermes-Agent GitHub: https://github.com/NousResearch/hermes-agent
Dev.to 技术博客: Hermes-Agent vs OpenClaw 对比分析
FutureAGI 博客: OSS Agent Frameworks 2026 盘点
夜雨聆风
