为什么你的 AI 助手总是「断片」?Hermes Agent 给了另一个答案-夜雨聆风

为什么你的 AI 助手总是「断片」?Hermes Agent 给了另一个答案

半个月冲到 35K Star，这个开源项目想让 AI 真正变成你的「数字员工」——而不是你每天都要重新自我介绍的聊天机器人。

你有没有这样的经历？

每次打开 ChatGPT，先花五分钟描述上下文。昨天聊到哪了、什么格式、什么风格——每次都要重新来一遍。就像每天上班都要重新面试一样荒谬。

这不是你的问题。是工具的问题。

绝大多数 AI 工具的设计逻辑是「对话」，用完即弃。但现实中的工作不是一段段独立对话，而是连续的、有关联的、需要记忆的任务流。

Hermes Agent 想解决的就是这件事。

它到底是什么

Nous Research 今年 2 月底开源的一个 AI Agent 框架。说「框架」可能太抽象了，换个说法：一个 24 小时在线的数字员工。

你关掉电脑它还在跑，你睡着了它还在处理任务。它不是用来聊天的，是用来干活的。

跟其他 Agent 工具相比，它有一个最让我在意的特性：**越用越聪明**。完成一个复杂任务后，它会自动把执行过程提炼成一份可复用的「技能文档」，下次遇到类似任务直接调用。社区里有用户反馈，两小时内自动生成了三份技能，重复任务速度提升 40%。

这跟「记忆」不是一个概念。记忆是被动的，技能是主动的。它能从经验里提炼方法，而不只是记住发生过什么。

怎么装：三步搞定

环境要求很简单：macOS 或 Linux 直接装，Windows 用户需要先装 WSL2。

第一步：一行命令安装

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

脚本会自动搞定 Python、Node.js、Git 等依赖，创建全局 hermes 命令。

网络不好的话多等一会儿，别中途关终端。

第二步：配置模型

安装完自动进入引导，选 Quick setup。模型推荐 OpenRouter——注册后有免费模型可用（比如 google/gemma-4-31b-it:free），零成本先体验。

注意：Claude 订阅接入 4 月 7 日起已失效，Anthropic 调整了政策，第三方工具不再走订阅额度。优先用 OpenRouter。

配置最后会问是否注册系统服务，选 Y 可以开机自启。

第三步：验证

hermes doctor

输出全绿就没问题。

装完在终端输入 hermes 能看到对话界面，说明成功了。如果提示 command not found，执行 source ~/.bashrc 或重新打开终端。

接入 Telegram：手机上直接用

不想只在终端里聊的话，可以接入 Telegram。

创建 Bot： 打开 Telegram 搜索 BotFather，发送 /newbot，按提示创建，拿到 API Token。

配置： 终端运行 hermes gateway setup，选 Telegram，粘贴 Token。

粘贴时终端不会显示任何内容，这是安全设计，直接回车确认。

然后填入你的 Telegram 数字 ID（给 @userinfobot 发消息就能查到），不填则任何人都能用你的 Bot。

配对成功后，在 Telegram 里给 Bot 发消息，能收到回复就 OK 了。

飞书、企业微信、钉钉、Discord、WhatsApp 的配置也大同小异，引导菜单里都有。

五个值得说说的特性

技能自动生成。 这是最核心的能力。完成一个任务后，Hermes 会把整个过程沉淀成 Markdown 文档存起来，下次直接调用。更关键的是它会记录调用次数，到一定次数自动调优。不是嘴上说说「越用越好」，是真的在迭代。

分层记忆。 核心信息常驻 MEMORY.md，每次对话都带着；历史对话全量存 SQLite，按需检索。对比之下，很多 Agent 工具的做法是把历史上下文全塞进 prompt——记得越多，token 烧得越多。Hermes 按需召回，用得越久成本反而稳定。

透明执行过程。 IM 里能看到 tool_call 的每一步，知道 Agent 正在干什么。这点对信任感很重要——黑盒让人焦虑，透明让人安心。

语音交互。 CLI 里按 Ctrl+B 录音，Telegram / Discord 里可以直接语音对话。支持本地 Whisper 免费识别。日常用不到，但有需要时是个加分项。

人格定制。 在 ~/.hermes/SOUL.md 里写几行描述，就能定义 Agent 的人格、说话风格、处事偏好。想要务实的工程师还是幽默的助理，随你定义。

费用和安全

费用： 社区实测，同等使用强度下比同类工具便宜 30%-60%。原因在架构——按需召回记忆 vs 全量塞 prompt。

安全： 七层防御机制——用户授权白名单、危险命令人工审批、Docker 容器隔离、凭证过滤、内容注入扫描、URL 验证、预执行攻击检测。高风险操作默认需要人工确认，超时自动拒绝。

两个提醒：

接入 Telegram 后账号就是控制入口，务必开启两步验证

自动生成的技能会被反复调用，有问题的要手动清理

从别的工具迁移过来

如果你之前在用 OpenClaw，内置了迁移命令：

hermes claw migrate

会自动导入原有的技能、记忆和设置，很多命令也大同小异，迁移成本低。

不想用命令行？

两个选择：

Hermes WebUI：专为 Hermes 开发的网页界面，比命令行直观不少

接入现有工具：Hermes 兼容 OpenAI API 格式，Open WebUI、Cherry Studio 等支持自定义 API endpoint 的工具都能直接接入

最后说两句

从「能聊天」到「能干活」再到「能进化」，AI Agent 的竞争正在从功能层面转向架构层面。

Hermes 的核心思路很清晰：不是帮你聊得更好，而是帮你干得更好。技能系统解决的是经验沉淀，分层记忆解决的是成本控制，透明执行解决的是信任问题。

每一个设计决策背后都有清晰的取舍逻辑。这在当下这个「堆功能」的 AI 圈里，算是一股清流。

有兴趣的话可以自己装一个试试，零成本上手，体验一下「越用越聪明」到底是什么感觉。

官方文档：hermes-agent.nousresearch.com/docs
GitHub：github.com/NousResearch/hermes-agent