AI · Hermes Agent:开源 AI Agent 框架,Multi-Agent 协作与持久记忆的新范式

凌晨三点，一位开发者盯着屏幕叹气。他的 AI Agent 刚刚在第 47 次对话中，彻底忘记了用户三天前说过的核心需求。"抱歉，我不记得我们讨论过什么"，这行冰冷的文字像一盆冷水，浇灭了用户最后的耐心。

这不是个例。在企业级 AI 应用中，"记忆丧失" 是 Agent 落地最大的绊脚石。用户期待的是一位能记住上下文、了解历史偏好、能够持续成长的智能助手，而现实中 AI 却像个金鱼——每次对话都是全新的开始。

如何让 AI Agent 真正拥有"记忆"？如何让多个 Agent 像一支配合默契的团队一样协作？这些问题，Hermes Agent 框架试图给出答案。

一、为什么你的 AI Agent 总像"失忆症患者"

在深入 Hermes Agent 之前，我们需要理解一个核心问题：为什么传统 AI Agent 总是"失忆"？

这要从大语言模型的本质说起。LLM 的输入是一个有限长度的上下文窗口，输出是对这个上下文的"续写"。无论是 GPT-4 的 128K 上下文还是 Claude 的 200K 上下文，都是有上限的。当对话长度超过这个上限，最早的对话内容就会被"挤出"上下文窗口，永久丢失。

这就解释了为什么：

对话轮次多了，AI 开始"健忘"
用户上周提的需求，AI 今天完全不知道
多轮交互后，AI 开始自相矛盾
需要重新输入大量背景信息

更糟糕的是，当我们需要构建多个 Agent 协作的系统时，这个问题会指数级放大。每个 Agent 都维护自己的上下文，Agent 之间如何共享信息？当任务需要跨 Agent 流转时，历史状态如何传递？

正是为了解决这些痛点，Hermes Agent 框架应运而生。它提供了一套完整的解决方案：持久记忆系统 + Multi-Agent 协作框架，让 AI Agent 真正变得"有记忆、会协作"。

二、Hermes Agent 核心架构解析

Hermes Agent 是一个专为 Multi-Agent 协作和持久记忆设计的开源框架。它的名字源自希腊神话中的信使赫尔墨斯——这位神祇穿梭于神界与人界之间，传递信息、沟通有无，而这正是现代 AI Agent 系统最需要的能力。

2.1 整体架构一览

┌─────────────────────────────────────────────────────────────┐│                        Hermes Agent                         ││                     多层协作架构                              │├─────────────────────────────────────────────────────────────┤│                                                             ││   ┌─────────────┐   ┌─────────────┐   ┌─────────────┐      ││   │  Agent A    │◄──│  消息总线    │──►│  Agent B    │      ││   │  (规划师)   │   │  MessageBus │   │  (执行者)   │      ││   └──────┬──────┘   └──────┬──────┘   └──────┬──────┘      ││          │                 │                 │             ││          │          ┌──────▼──────┐          │             ││          │          │  记忆系统   │◄─────────┘             ││          │          │ MemoryStore │                         ││          │          └──────┬──────┘                         ││          │                 │                                 ││   ┌──────▼──────┐   ┌──────▼──────┐   ┌─────────────┐      ││   │  短期记忆    │   │  长期记忆    │   │  共享知识库  │      ││   │  Context    │   │  Persistent │   │  Knowledge  │      ││   └─────────────┘   └─────────────┘   └─────────────┘      ││                                                             │└─────────────────────────────────────────────────────────────┘

从架构图中可以看到，Hermes Agent 的核心由三部分组成：

1. Agent 节点层：每个 Agent 是独立的功能单元，可以是规划师、执行者、审查者等角色。它们各自承担特定职责，通过消息总线进行通信。

2. 消息总线：所有 Agent 之间的通信都通过中央消息总线进行。这保证了消息的有序性、可追踪性，也为系统的可观测性提供了基础。

3. 记忆系统：这是 Hermes Agent 最具创新性的部分。它分为三层：

短期记忆：当前会话的上下文，与传统 LLM 上下文相同
长期记忆：持久化的历史信息，存储在外部存储系统中
共享知识库：跨 Agent 的共享信息，所有 Agent 都可以访问

2.2 Agent 的生命周期

在 Hermes Agent 中，每个 Agent 都有自己的生命周期：

  ┌─────────┐     ┌─────────┐     ┌─────────┐     ┌─────────┐  │  创建   │────►│  初始化 │────►│  运行   │────►│  挂起   │  └─────────┘     └─────────┘     └────┬────┘     └─────────┘                                        │                ▲                                        │                │                                        ▼                │                                   ┌─────────┐           │                                   │  完成   │───────────┘                                   └─────────┘

Agent 被创建后，首先加载自己的记忆和配置，然后进入运行状态。在运行过程中，Agent 可以：

处理接收到的消息
调用外部工具
访问记忆系统
向其他 Agent 发送消息

当任务完成后，Agent 会将重要信息写入长期记忆，然后进入完成状态或等待下一个任务。

三、Multi-Agent 协作：让 Agent 像团队一样工作

单个 Agent 再强大，也有能力边界。真正的智能系统，需要多个 Agent 协同工作。Hermes Agent 提供了三种经典的协作模式。

3.1 层级协作模式

这是最直观的模式：有一个主 Agent（规划者）负责任务分解，其他 Agent（执行者）负责具体执行，结果汇总给主 Agent。

想象一个写作助手的场景：

主 Agent：分析用户需求，规划文章结构
研究员 Agent：搜集相关资料和数据
写手 Agent：根据大纲撰写正文
审稿 Agent：检查逻辑、语法、事实错误

这种模式适合流程明确、步骤清晰的任务。主 Agent 像项目经理一样，把大任务拆成小任务，分派给合适的执行者。

3.2 对等协作模式

没有主次之分，多个 Agent 围绕同一个问题各自发表意见，协商达成共识。

         ┌──────────────┐         │   用户问题   │         └──────┬───────┘                │         ┌──────▼───────┐         │  广播消息    │         └──────┬───────┘                │    ┌───────────┼───────────┐    ▼           ▼           ▼┌───────┐   ┌───────┐   ┌───────┐│Agent A│   │Agent B│   │Agent C││(技术) │   │(产品) │   │(用户) │└───┬───┘   └───┬───┘   └───┬───┘    │           │           │    └───────────┼───────────┘                │         ┌──────▼───────┐         │  意见汇总    │         └──────┬───────┘                │         ┌──────▼───────┐         │  共识形成    │         └──────────────┘

这种模式适合需要多角度分析的场景。比如评估一个新功能，技术 Agent 看可行性，产品 Agent 看市场，客服 Agent 看用户体验，综合三方意见才能得出全面结论。

3.3 管道协作模式

数据像流水线上的产品一样，依次经过各个 Agent 的处理，每个 Agent 只做一件事，但做得非常专业。

用户输入 ──► Agent A ──► Agent B ──► Agent C ──► 最终输出(清洗)    (转换)    (分析)    (格式化)

这种模式适合数据处理类任务。想象一个日志分析系统：

Agent A 负责日志解析和结构化
Agent B 负责异常检测和分类
Agent C 负责生成分析报告和可视化建议

四、持久记忆系统：让 Agent 真正"记住一切"

这是 Hermes Agent 最具差异化的特性。与其名字的灵感来源——信使赫尔墨斯——一样，这个框架让信息能够在 Agent 之间、对话之间持久流动。

4.1 记忆的分层存储

Hermes Agent 的记忆系统分为三层，各司其职：

第一层：上下文记忆（Context Memory）

这是最"短命"的记忆，与传统 LLM 上下文一致。当会话结束，这些信息就消失。

# 上下文记忆的典型使用context = {"current_task": "分析Q3销售数据","recent_turns": [        {"role": "user", "content": "帮我分析Q3的数据"},        {"role": "assistant", "content": "好的，请提供数据源"}    ]}

第二层：会话记忆（Session Memory）

记录整个会话期间的重要信息。当用户重新打开对话时，可以加载这些记忆。

# 会话记忆的存储结构session_memory = {"session_id": "abc123","user_profile": {"name": "张先生","preferences": ["喜欢详细分析", "偏好中文回复"]    },"key_decisions": ["使用柱状图展示数据","重点关注华东区"    ],"unfinished_tasks": ["等待用户提供销售数据"]}

第三层：持久记忆（Persistent Memory）

这是 Hermes Agent 的核心创新。信息被存储在外部持久化系统中，即使会话结束、服务器重启，记忆依然存在。

# 持久记忆的存储persistent_memory = {"user_id": "user_001","long_term_preferences": {"communication_style": "简洁专业","report_format": "markdown","timezone": "Asia/Shanghai"    },"interaction_history": [        {"date": "2024-01-15","task": "生成月度报告","outcome": "success"        },        {"date": "2024-01-20","task": "代码审查","outcome": "success"        }    ],"learned_knowledge": {"常用报表模板": "标准财务三表","数据源": "ERP系统和CRM系统"    }}

4.2 记忆的写入与检索

记忆系统需要解决两个核心问题：什么时候写和怎么检索。

记忆写入策略：

Hermes Agent 不会盲目写入所有信息，而是基于重要性评估：

classMemoryWriter:defevaluate_importance(self, info: dict) -> float:"""        评估信息的重要性，范围 0.0 ~ 1.0        高于阈值的信息才会写入持久记忆        """        importance = 0.0# 用户明确表达偏好 - 高权重if info.get("explicit_preference"):            importance += 0.6# 涉及关键决策 - 中权重if info.get("key_decision"):            importance += 0.3# 高频出现的内容 - 中权重if info.get("frequency", 0) > 3:            importance += 0.2returnmin(importance, 1.0)defwrite_memory(self, agent_id: str, info: dict):        importance = self.evaluate_importance(info)if importance >= 0.5:  # 阈值可配置self.persistent_store.save(                agent_id=agent_id,                content=info,                importance=importance,                timestamp=datetime.now()            )

记忆检索策略：

检索不是简单的关键词匹配，而是语义检索：

classMemoryRetriever:defretrieve(self, agent_id: str, query: str, top_k: int = 5) -> list:"""        基于语义相似度检索记忆        """# 1. 将查询向量化        query_embedding = self.embedding_model.encode(query)# 2. 在持久记忆库中搜索相似记忆        memories = self.persistent_store.search(            agent_id=agent_id,            embedding=query_embedding,            top_k=top_k        )# 3. 按时间衰减和重要性重新排序        memories = self._rerank(memories)return memories

这种设计确保了：

Agent 只记住真正重要的信息，避免记忆"爆炸"
检索时能找到语义相关但表述不同的历史记忆
越新的记忆、越重要的记忆越容易被检索到

4.3 跨 Agent 记忆共享

在 Multi-Agent 系统中，记忆不仅可以在单个 Agent 内部流转，还可以在不同 Agent 之间共享。

classSharedKnowledgeBase:"""共享知识库，允许跨 Agent 访问"""defwrite_shared(self, key: str, value: any, namespace: str = "global"):"""        写入共享知识        namespace 用于隔离不同项目的知识        """self.redis.hset(f"shared:{namespace}",            key,            json.dumps(value)        )defread_shared(self, key: str, namespace: str = "global") -> any:"""读取共享知识"""        data = self.redis.hget(f"shared:{namespace}", key)return json.loads(data) if data elseNone

例如，在一个代码审查 Multi-Agent 系统中：

语言专家 Agent 识别出代码使用的语言和框架，写入共享知识库
安全专家 Agent 从共享知识库读取语言信息，更有针对性地检查
性能专家 Agent 同样读取共享知识，避免重复识别

这样，每个 Agent 不用每次都从头分析，降低了 tokens 消耗，也加快了响应速度。

五、实战：用 Hermes Agent 构建一个智能助手

光说不练假把式。让我们用 Hermes Agent 构建一个有点意思的应用：多角色协作的写作助手。

这个系统包含三个 Agent：

Planner Agent：理解用户需求，规划文章结构
Writer Agent：负责撰写正文
Reviewer Agent：检查文章质量，提出修改建议

5.1 环境准备

pip install hermes-agentpip install redis  # 用于记忆存储

5.2 定义 Agent

from hermes import Agent, MessageBus, MemoryStorefrom hermes.patterns import HierarchicalCollaboration# 初始化消息总线message_bus = MessageBus()# 初始化记忆存储（使用 Redis）memory_store = MemoryStore(    backend="redis",    host="localhost",    port=6379)# 定义 Planner Agentplanner = Agent(    name="planner",    role="规划师",    system_prompt="""你是一位经验丰富的写作规划师。    用户提出写作需求时，你需要：    1. 理解用户的核心诉求    2. 规划文章的结构和重点    3. 将规划写入记忆，以便后续 Agent 使用    """,    memory_store=memory_store,    message_bus=message_bus)# 定义 Writer Agentwriter = Agent(    name="writer",    role="写手",    system_prompt="""你是一位文笔优美的内容创作者。    你需要：    1. 从 Planner Agent 获取文章大纲    2. 按照大纲撰写正文    3. 注意文章的可读性和逻辑性    """,    memory_store=memory_store,    message_bus=message_bus)# 定义 Reviewer Agentreviewer = Agent(    name="reviewer",    role="审稿",    system_prompt="""你是一位严格的内容审核专家。    你需要：    1. 检查文章的逻辑连贯性    2. 指出事实错误或表述不清的地方    3. 提出具体的修改建议    """,    memory_store=memory_store,    message_bus=message_bus)

5.3 配置协作流程

# 定义层级协作流程collaboration = HierarchicalCollaboration(    supervisor=planner,    workers=[writer, reviewer],    message_bus=message_bus)# 配置任务路由规则collaboration.add_rule(    trigger="task_type:writing",    flow=[        {"from": "planner", "action": "plan"},        {"from": "planner", "to": "writer", "action": "delegate"},        {"from": "writer", "to": "reviewer", "action": "submit"},        {"from": "reviewer", "to": "planner", "action": "report"},    ])

5.4 启动协作

# 用户输入写作需求user_request = """请帮我写一篇关于 AI Agent 发展趋势的文章。目标读者是中级工程师，需要有一定技术深度，但也要保证可读性，大约 3000 字左右。"""# 启动协作流程result = collaboration.run(    task_type="writing",    initial_message=user_request,    user_id="user_001")# 输出最终结果print(result.content)

当这个系统运行时，你会在日志中看到精彩的 Multi-Agent 协作过程：

[09:30:15] Planner: 收到任务，开始分析需求...[09:30:16] Planner: 规划文章结构...[09:30:18] Planner: → Writer: 请根据以下大纲撰写正文[09:30:19] Writer: 收到大纲，开始撰写...[09:30:35] Writer: 撰写完成，提交给 Reviewer[09:30:36] Reviewer: 收到文章，开始审核...[09:30:42] Reviewer: 发现3处可优化的地方，建议修改[09:30:43] Reviewer: → Planner: 审核完成[09:30:44] Planner: 整合最终版本...[09:30:45] Collaboration: 任务完成

5.5 验证记忆持久化

如果我们关闭对话，稍后再打开：

# 模拟用户再次对话new_request = "继续上次的工作，帮我润色第二部分"# 重新加载记忆planner.load_memory(user_id="user_001")writer.load_memory(user_id="user_001")reviewer.load_memory(user_id="user_001")# 继续协作result = collaboration.run(    task_type="writing_refine",    initial_message=new_request,    user_id="user_001")

Agent 会记住：

上次写的是关于 AI Agent 发展趋势的文章
文章已经写到了第二部分
用户偏好"专业但不晦涩"的风格
第三部分还未完成

这就是持久记忆的力量——用户不需要重复说"上次那篇文章"。

六、技术原理：Hermes Agent 背后的设计哲学

看完了实战演示，我们来深入一点，聊聊 Hermes Agent 背后的技术原理和设计哲学。

6.1 消息传递机制

Multi-Agent 系统的核心是消息传递。Hermes Agent 采用发布-订阅模式：

classMessageBus:"""消息总线 - Agent 之间通信的中央枢纽"""def__init__(self):self.subscribers = defaultdict(list)self.message_queue = Queue()self.message_history = []defpublish(self, topic: str, message: Message):"""发布消息到指定主题"""self.message_history.append(message)for callback inself.subscribers[topic]:            callback(message)defsubscribe(self, topic: str, callback: Callable):"""订阅主题，接收消息"""self.subscribers[topic].append(callback)

每个 Agent 可以订阅自己感兴趣的主题：

# Planner 订阅 Writer 的完成通知message_bus.subscribe("writer/completed", planner.on_writer_completed)# Writer 订阅 Planner 的任务分配message_bus.subscribe("planner/delegate", writer.on_delegated_task)

这种设计带来了几个好处：

松耦合：Agent 之间不需要直接引用，降低了系统复杂度
可扩展：可以轻松添加新的 Agent，只要订阅相关主题
可观测：所有消息都经过总线，便于监控和调试

6.2 记忆一致性

在分布式系统中，保持记忆一致性是个难题。Hermes Agent 采用 最终一致性 策略：

classMemoryStore:"""记忆存储 - 保证最终一致性"""defsave(self, agent_id: str, key: str, value: any):"""        写入记忆，使用 write-ahead log 保证持久性        """# 1. 先写入 WAL（预写日志）self.wal.write({"agent_id": agent_id,"key": key,"value": value,"timestamp": time.time()        })# 2. 异步写入主存储self._async_write(agent_id, key, value)def_async_write(self, agent_id: str, key: str, value: any):"""        异步写入存储层，失败时重试        """defretry_write():for attempt inrange(3):try:self.redis.hset(f"memory:{agent_id}",                        key,                        json.dumps(value)                    )returnexcept RedisError:                    time.sleep(1 * (attempt + 1))  # 指数退避continue# 超过重试次数，记录错误但不影响主流程            logger.error(f"Failed to write memory after retries")# 使用后台线程执行，避免阻塞主流程        Thread(target=retry_write, daemon=True).start()

6.3 Agent 状态机

每个 Agent 内部是一个状态机，确保状态转换的正确性：

                    ┌────────────────────────────────────┐                    │                                    │                    ▼                                    │              ┌──────────┐     ┌──────────┐     ┌──────┴────┐         ───► │   IDLE   │────►│ RUNNING  │────►│ WAITING  │              └──────────┘     └─────┬────┘     └──────────┘                    ▲               │                │                    │               │                │                    │               ▼                │                    │          ┌──────────┐          │                    └──────────│  ERROR   │◄─────────┘                               └──────────┘

状态转换规则：

IDLE → RUNNING：收到有效消息
RUNNING → WAITING：需要外部资源（如调用工具）
WAITING → RUNNING：外部资源就绪
任意 → ERROR：发生不可恢复的错误
ERROR → IDLE：错误恢复，重置状态

七、适用场景与局限

7.1 Hermes Agent 擅长的场景

需要长期上下文的客服系统：记住用户的历史问题和偏好
复杂任务的自动化流程：如代码审查、数据分析报告生成
企业知识管理系统：跨 Agent 共享组织知识
个人 AI 助手：像真人助理一样记住你的习惯和需求

7.2 需要注意的局限

记忆存储的成本：持久化存储和向量化都需要成本
隐私保护：记忆系统需要严格的数据隔离和访问控制
一致性挑战：多 Agent 并发访问记忆时的一致性
框架学习曲线：比简单调用 API 要复杂

八、总结与展望

Hermes Agent 框架给我们展示了一种可能：让 AI Agent 真正拥有记忆、能够协作。

它解决的不只是技术问题，更是一种范式转变：

从"每次对话都是新的开始"到"持续学习、不断成长"
从"单兵作战的 AI"到"协同配合的 AI 团队"
从"有限上下文"到"无限记忆"

当然，框架只是起点。真正的价值在于你用它来解决什么问题。

如果你正在构建：

需要记住用户偏好的智能产品
需要多角色协作的企业应用
需要长期记忆的个人助手

不妨试试 Hermes Agent。它可能正是你寻找的那块拼图。

思考题：在你的业务场景中，有哪些地方可以用 Multi-Agent 协作来提升效率？有哪些用户痛点可以通过持久记忆来解决？欢迎在评论区分享你的想法。

如果你对 Hermes Agent 感兴趣，可以访问其 GitHub 仓库了解更多信息。开源社区期待你的贡献。

本文演示代码已简化处理，实际使用请参考官方文档。