乐于分享
好东西不私藏

为什么你的 AI 助手总是「断片」?Hermes Agent 给了另一个答案

为什么你的 AI 助手总是「断片」?Hermes Agent 给了另一个答案

半个月冲到 35K Star,这个开源项目想让 AI 真正变成你的「数字员工」——而不是你每天都要重新自我介绍的聊天机器人。

你有没有这样的经历?

每次打开 ChatGPT,先花五分钟描述上下文。昨天聊到哪了、什么格式、什么风格——每次都要重新来一遍。就像每天上班都要重新面试一样荒谬。

这不是你的问题。是工具的问题。

绝大多数 AI 工具的设计逻辑是「对话」,用完即弃。但现实中的工作不是一段段独立对话,而是连续的、有关联的、需要记忆的任务流。

Hermes Agent 想解决的就是这件事。

它到底是什么

Nous Research 今年 2 月底开源的一个 AI Agent 框架。说「框架」可能太抽象了,换个说法:一个 24 小时在线的数字员工。

你关掉电脑它还在跑,你睡着了它还在处理任务。它不是用来聊天的,是用来干活的。

跟其他 Agent 工具相比,它有一个最让我在意的特性:**越用越聪明**。完成一个复杂任务后,它会自动把执行过程提炼成一份可复用的「技能文档」,下次遇到类似任务直接调用。社区里有用户反馈,两小时内自动生成了三份技能,重复任务速度提升 40%。

这跟「记忆」不是一个概念。记忆是被动的,技能是主动的。它能从经验里提炼方法,而不只是记住发生过什么。

怎么装:三步搞定

环境要求很简单:macOS 或 Linux 直接装,Windows 用户需要先装 WSL2。

第一步:一行命令安装

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

脚本会自动搞定 Python、Node.js、Git 等依赖,创建全局 hermes 命令。

网络不好的话多等一会儿,别中途关终端。

第二步:配置模型

安装完自动进入引导,选 Quick setup。模型推荐 OpenRouter——注册后有免费模型可用(比如 google/gemma-4-31b-it:free),零成本先体验。

注意:Claude 订阅接入 4 月 7 日起已失效,Anthropic 调整了政策,第三方工具不再走订阅额度。优先用 OpenRouter。

配置最后会问是否注册系统服务,选 Y 可以开机自启。

第三步:验证

hermes doctor

输出全绿就没问题。

装完在终端输入 hermes 能看到对话界面,说明成功了。如果提示 command not found,执行 source ~/.bashrc 或重新打开终端。

接入 Telegram:手机上直接用

不想只在终端里聊的话,可以接入 Telegram。

创建 Bot: 打开 Telegram 搜索 BotFather,发送 /newbot,按提示创建,拿到 API Token。

配置: 终端运行 hermes gateway setup,选 Telegram,粘贴 Token。

粘贴时终端不会显示任何内容,这是安全设计,直接回车确认。

然后填入你的 Telegram 数字 ID(给 @userinfobot 发消息就能查到),不填则任何人都能用你的 Bot。

配对成功后,在 Telegram 里给 Bot 发消息,能收到回复就 OK 了。

飞书、企业微信、钉钉、Discord、WhatsApp 的配置也大同小异,引导菜单里都有。

五个值得说说的特性

技能自动生成。 这是最核心的能力。完成一个任务后,Hermes 会把整个过程沉淀成 Markdown 文档存起来,下次直接调用。更关键的是它会记录调用次数,到一定次数自动调优。不是嘴上说说「越用越好」,是真的在迭代。

分层记忆。 核心信息常驻 MEMORY.md,每次对话都带着;历史对话全量存 SQLite,按需检索。对比之下,很多 Agent 工具的做法是把历史上下文全塞进 prompt——记得越多,token 烧得越多。Hermes 按需召回,用得越久成本反而稳定。

透明执行过程。 IM 里能看到 tool_call 的每一步,知道 Agent 正在干什么。这点对信任感很重要——黑盒让人焦虑,透明让人安心。

语音交互。 CLI 里按 Ctrl+B 录音,Telegram / Discord 里可以直接语音对话。支持本地 Whisper 免费识别。日常用不到,但有需要时是个加分项。

人格定制。~/.hermes/SOUL.md 里写几行描述,就能定义 Agent 的人格、说话风格、处事偏好。想要务实的工程师还是幽默的助理,随你定义。

费用和安全

费用: 社区实测,同等使用强度下比同类工具便宜 30%-60%。原因在架构——按需召回记忆 vs 全量塞 prompt。

安全: 七层防御机制——用户授权白名单、危险命令人工审批、Docker 容器隔离、凭证过滤、内容注入扫描、URL 验证、预执行攻击检测。高风险操作默认需要人工确认,超时自动拒绝。

两个提醒:

  • 接入 Telegram 后账号就是控制入口,务必开启两步验证
  • 自动生成的技能会被反复调用,有问题的要手动清理

从别的工具迁移过来

如果你之前在用 OpenClaw,内置了迁移命令:

hermes claw migrate

会自动导入原有的技能、记忆和设置,很多命令也大同小异,迁移成本低。

不想用命令行?

两个选择:

  • Hermes WebUI:专为 Hermes 开发的网页界面,比命令行直观不少
  • 接入现有工具:Hermes 兼容 OpenAI API 格式,Open WebUI、Cherry Studio 等支持自定义 API endpoint 的工具都能直接接入

最后说两句

从「能聊天」到「能干活」再到「能进化」,AI Agent 的竞争正在从功能层面转向架构层面。

Hermes 的核心思路很清晰:不是帮你聊得更好,而是帮你干得更好。技能系统解决的是经验沉淀,分层记忆解决的是成本控制,透明执行解决的是信任问题。

每一个设计决策背后都有清晰的取舍逻辑。这在当下这个「堆功能」的 AI 圈里,算是一股清流。

有兴趣的话可以自己装一个试试,零成本上手,体验一下「越用越聪明」到底是什么感觉。

官方文档:hermes-agent.nousresearch.com/docs
GitHub:github.com/NousResearch/hermes-agent