大家好,我是小小。
写在前面
最近 AI Agent 这个赛道特别卷,各种开源项目层出不穷。我之前一直在关注 Hermes Agent——Nous Research 做的那个自托管 AI Agent,据说 GitHub 星标已经快 20 万了。
不过说实话,我一直有个痛点:CLI 终端用着虽然酷,但日常聊天、查文件、切换会话,还是浏览器更方便。
前两天刷 GitHub 发现一个社区项目 hermes-webui,专门给 Hermes Agent 做了一个 Web 界面。我抱着试试看的心态部署了一下,结果发现——好家伙,这比我想象中好用太多了。
🔍 这项目是干嘛的
简单说,hermes-webui 就是 Hermes Agent 的浏览器前端。
Hermes Agent 本身是个运行在你服务器上的 AI Agent,支持持久记忆、定时任务、自动写技能、多平台消息接入这些功能。但默认只能通过终端交互。
hermes-webui 给它套了一个三栏布局的 Web 界面:左边是会话列表,中间是聊天区,右边是文件浏览器。底部有个控制栏可以切换模型、查看配置、管理工作区。
整个过程不需要构建工具,不需要前端框架,就是 Python 后端加原生 JS,轻量得很。
我试了一下,通过 SSH 隧道连上去,手机上也能直接用,体验跟本地桌面端差不多。
✅ 几个我觉得特别亮的设计
持久记忆直接可用
这是整个 Hermes 体系最核心的卖点。WebUI 里一样能用。
就是说,你今天跟它说了一堆项目背景、命名习惯、技术栈偏好,明天开个新会话,它全记得。不像 ChatGPT 那样每个会话从零开始。
我之前在开发安守密码的时候,经常要反复跟 AI 解释 iOS 的各种约束和设计规范。如果当时有这种持久记忆的 Agent,能省不少口舌。
跨会话搜索
这个功能让我眼前一亮。
所有历史会话的内容都可以搜索,而且支持按标题和消息内容模糊查找。你两周前跟 AI 讨论过的某个技术方案,直接搜关键词就能翻出来。
相当于给 AI 对话加了一个搜索引擎。
语音输入
WebUI 里集成了浏览器的 Web Speech API,底部有个麦克风按钮。按住说话,松手自动转文字,然后发给 AI。
这个功能看着不起眼,但用起来真的很方便。特别是躺在床上用手机跟 AI 聊方案的时候,打字确实费劲。
安全设计挺到位
支持密码登录,还支持 WebAuthn/Passkey 无密码认证。登录后是 HMAC 签名的 HTTP-only Cookie,24 小时过期。
还有个危险命令审批机制——AI 要执行可能有风险的 shell 命令时,会弹出确认卡片让你批准或拒绝。这个设计我觉得非常必要。
手机也能用
通过 SSH 隧道或者 Tailscale 访问,手机浏览器打开就是个完整的聊天界面。
我测试了一下,iPhone 上用 Safari 访问,响应式布局做得不错,三栏自动切换成更适合移动端的形式。
🚀 快速上手
部署其实非常简单,三步就行:
# 克隆项目git clone https://github.com/nesquena/hermes-webui.gitcd hermes-webui# 运行引导脚本(自动检测环境)python3 bootstrap.py它会自动检测你有没有装 Hermes Agent,没有的话会帮你装。然后启动 Web 服务,浏览器自动打开。
如果你在远程服务器上部署,启动时加个 --no-browser 参数,然后用 SSH 隧道转发端口就行:
# 服务器端HERMES_WEBUI_HOST=0.0.0.0 ./ctl.sh start# 本地转发ssh -L 8080:localhost:8080 your-server也支持 Docker 一键部署,直接 docker compose up -d 就完事。
💡 什么场景下值得用
我觉得比较适合这几类人:
- 已经部署了 Hermes Agent 的用户
:这个不用想了,装就完了,体验提升非常大 - 喜欢命令行但偶尔需要图形界面的开发者
:平时用 CLI,需要的时候切 Web,两不耽误 - 想在手机上随时跟 AI 聊天的朋友
:SSH 隧道一开,手机浏览器直接用 - 对数据隐私比较敏感的人
:所有数据都在你自己的服务器上,不像用 ChatGPT 那样数据全在云端
不过话说回来,如果你只是偶尔用 AI 聊聊天,或者已经习惯用 ChatGPT 的 Web 界面,那确实没必要折腾这个。它的价值在于自主可控和持久记忆,这两个点对重度 AI 用户来说才是真正的杀手锏。
🤔 我的一些思考
其实整个 AI Agent 赛道现在最核心的竞争,已经不是谁的模型更聪明了——底层模型大家都差不多,OpenAI、Anthropic、Google、DeepSeek 你选谁都行。
真正的差异化在于三点:记忆能不能持久化、能不能自动执行任务、能不能多平台接入。
hermes-webui 这个项目有意思的地方在于,它没有重新发明轮子,而是在已有的 Hermes Agent 基础上,补上了最后一块短板——一个好用的 Web 界面。
这种"站在巨人肩膀上补短板"的思路,其实挺值得学习。很多时候开源社区缺的不是核心能力,而是用户体验的打磨。
结语
总的来说,如果你已经在用 Hermes Agent,或者打算试试自托管 AI Agent,hermes-webui 绝对值得装一下。轻量、好用、功能齐全,体验比纯终端提升了一大截。
如果还没接触过 Hermes Agent,也可以趁这个机会了解一下——一个能记住你、能在你睡觉时帮你干活、还能自动变聪明的 AI Agent,用习惯了真的回不去了。
项目地址:https://github.com/nesquena/hermes-webui
(觉得有用请点赞、收藏、转发三连!有问题评论区见~)
夜雨聆风