关注上方蓝字"风景邮递Yuan",选择"设为置顶or星标"
第一时间获取前沿AI技术&AI资讯
文章底部可留言🌸
当前生态中最火的开源 Agent 框架 —— Hermes Agent(由 Nous Research 推出)
🔎 一、Hermes Agent 核心概念
Hermes Agent 是一个开源的自主执行 AI Agent 框架,由 Nous Research 发布(2026 年2 月),可以自我提升,支持工具调用和复杂任务执行。其设计目标是在自托管环境下提供类似现代商业 agent 的能力,但具备自学习记忆、内置工具生态、以及灵活的 LLM 后端选择。
核心特点
- 📌 自我提升能力:任务执行后将执行步骤和成功策略写入永久技能库,以便后续类似任务更快完成。
- ⚙️ 内置 40+ 工具支持:包括文件管理、web 浏览、终端执行、API 调用等。
- 🧠 记忆系统:episodic memory(事件记忆)让 Agent 能从失败和成功中学习(不改变底层模型权重,而是 retrieval‑based)。
- 🔄 跨平台交互:支持 CLI、Telegram、Discord、Slack、WhatsApp、Signal、Email 等多种客户端与消息平台。
- 🧩 模型无关(Model‑Agnostic):支持 OpenAI、Anthropic、Google/GLM 系列,还可以接入本地 Ollama 等任意 OpenAI‑兼容后端。
🏗️ 二、内部架构与工作流程
Hermes 的执行循环通常分为以下几个阶段:
- 输入解析 —— 接收用户请求或消息。
- 推理 + 任务规划 —— 通过大模型判断目标与拆解步骤。
- 工具调用执行 —— 根据计划依次调用工具。
- 记忆写入 & 技能提取 —— 任务结束后评估结果,形成可复用技能。
- 输出 & 持久化 —— 输出最终结果并存储日志、技能、session。
记忆和技能区别:
- 记忆(Memory):长期记住有用经验。
- 技能(Skills):可复用的流程模板(如自动化脚本)。
这些模块共同让 Agent 具备可持续学习能力。
🧠 三、Hermes 系列模型能力
Hermes Agent 本身是 Agent 框架,而具体执行核心则依靠你指定的大语言模型。当前常见后端包括:
主流模型选项(示例)
💡 模型不是 Hermes Agent 的一部分,你可以通过 API Key / 自定义端点接入任何兼容的后端。
⚙️ 四、最低配置与资源要求(实践要点)
根据官方说明和社区反馈,Hermes 对模型和运行环境有一些实际门槛:
✅ 模型端最低要求
- 模型至少支持 ~64 K context token 窗口 — 否则会出现 context too small 错误。
- 推荐使用 大模型 / 较长上下文模型(例如大型 GPT 或 Llama 微调权重)以更好地处理工具链与复杂任务。
如果你使用兼容的本地后端(如 Ollama),可以在配置中显式设置 context_length 以支持更大的令牌窗口。
🖥️ 服务器环境建议
Hermes 自身运行较轻,可部署在低成本 VPS,但:
- Agent 框架只有 控制逻辑和工具库(对 CPU/RAM 要求较低)。
- 推理模型的计算资源标准依赖你的后端:
- 使用云 API(OpenAI/Anthropic/OpenRouter):本地几乎无需 GPU。
- 本地推理(如 Ollama + Qwen/GLM):需要一定 GPU / 显存。
- 对于本地 8B 级模型:至少 8–12 GB VRAM 较为适宜。
- 对于大型模型(70B+ / 405B):通常需要 GPU + 大内存 或转向云 API。
(具体数值依赖所用框架,如 vLLM、bitsandbytes 量化策略等)
🛠️ 五、配置与实用指南(简要)
基础设置步骤
hermes setup—— 交互式完成提供商/模型/API Key 配置。hermes model—— 切换模型或后端。- 设置工具权限:
hermes tools—— 激活/禁用。
Hermes 会把配置存储在用户目录下的 ~/.hermes/config.yaml 和 .env 中,支持灵活覆盖与环境变量配置。
🧠 六、Agent 与模型之间的关系
- Hermes 是 Agent 框架和调度器,它本身并不包含语言模型权重。
- 它通过指定后端(API 端点或本地服务器)调用实际的大模型来生成响应和分解动作。
- Hermes 负责 工具绑定、记忆持久化、技能提取 这些高层逻辑。
图片来源网络,侵权联系删除
AI交流群|AI爱好者 欢迎关注讨论!
夜雨聆风