2026年,AI工具多到选不过来。但真正用得住的,往往不是功能最多的那个,而是最懂你场景的那个。今天说说我日常在用的 Hermes。

一句话定位
Hermes 是一个跑在终端里的 AI 助手,支持多模型接入(OpenRouter、Anthropic、DeepSeek、MiniMax 等),可以操作浏览器、写代码、管文件、调飞书/Discord/微信,最关键的是——它会记住你是谁、你的偏好、你教过它的事。
GitHub:https://github.com/NousResearch/hermes-agent[1]
安装:一条命令搞定
Linux / Mac / WSL 用户,终端里跑这一句:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash装完之后,跑一下初始化向导,选模型、设 API Key:
hermes setup就这些。没有 Docker,没有 conda,没有七八个依赖要装。
怎么用:两种模式
模式一:直接问
hermes chat -q "帮我写一封请假邮件"适合查东西、改稿子、问问题,一句话搞定。
模式二:进入对话
hermes回车之后进入交互式对话,可以连续追问、上传图片、让它执行复杂任务。
核心能力:4个我每天都在用的功能
1. 浏览器自动化
很多 AI 工具只能"给你建议",Hermes 能直接帮你操作浏览器——点按钮、填表单、截图、提取页面内容。
这在抓取数据、填表、自动发帖这些场景里,省的不是一点半点。
2. 文件和代码操作
读、写、搜索、批量修改文件都是基操。它能理解代码逻辑,帮你 review、debug、甚至直接写完整功能。
我自己的 PPT 生成流程,就是 Hermes 调用 python-pptx 自动完成的。
3. 多模型切换
同一套工具,按需切换模型。想省 token 用 DeepSeek,想效果好用 Claude,想免费用 MiniMax,一句话的事:
hermes model或者在对话里直接 /model claude-3-5-sonnet。
不用重新配置,不用开新窗口。
4. 跨平台消息
接入飞书、微信、Telegram、Discord 之后,Hermes 可以在这些平台里直接响应。
我目前的用法是接了飞书,日常沟通和任务管理都在里面,Hermes 在后台跑着,随时调它查东西、改稿子、生成内容。
它和其他AI工具有什么不同
Skills 是 Hermes 独有的一套机制:它会把解决过的问题、学会的工作流存下来,下次遇到同类任务直接调用,越用越懂你。
适合谁用
适合:
有技术背景,想把 AI 真正嵌入工作流的人 需要自动化重复操作的设计/开发/运营 希望一个工具通吃多平台、不用来回切换的人
不太适合:
纯鼠标操作、一点命令行都不想碰的人 期待开箱即用、完全不用配置的小白用户
几个具体场景举例
场景A:写文章
丢一个链接给 Hermes,它读取页面内容,整理成结构化笔记,直接写成 Markdown。
场景B:生成PPT
告诉它主题和大纲,它调用 python-pptx 生成 PPT 文件,字体、配色、版式都可以自定义。
场景C:浏览器操作
"帮我把这个表单填了"——它直接操作浏览器完成,不用你动手。
场景D:多模型对比
同一道题,同时问三个模型,对比答案,效率翻倍。
怎么配置国内模型(国内服务器用户)
国内服务器经常访问不了 OpenAI/Anthropic 的接口,用国内模型是更现实的选择。
MiniMax 配置示例:
hermes config set model.provider minimaxhermes auth add# 按提示输入 API Key配置完成后,默认模型就换成 MiniMax 了,速度快、延迟低。
写在最后
工具不在多,在于用透。
Hermes 对我来说,是一个真正能嵌进日常工作流的 AI 助手——不是问答机,不是搜索引擎,是一个能记住我的偏好、帮我执行任务的助手。
如果你也是那种"不想折腾,但想用好 AI"的人,值得试试。
官网文档:https://hermes-agent.nousresearch.com/docs/[2]
文中涉及的所有功能基于 Hermes 0.13.0 版本,不同版本功能可能有所差异。
引用链接
[1]https://github.com/NousResearch/hermes-agent
[2]https://hermes-agent.nousresearch.com/docs/

夜雨聆风