OpenClaw、Hermes 安装使用太麻烦?介绍一个开源国产平替:OpenHanako-夜雨聆风

OpenClaw、Hermes 安装使用太麻烦?介绍一个开源国产平替:OpenHanako

这两天在刷 B 站的时候刷到一个叫 liliMozi 的独立开发者。起初吸引我驻足的是她视频里的可爱的画风，比如这个：

接着就了解到了她的个人作品 OpenHanako，可以简单理解为 OpenClaw（🦞 小龙虾）、Hermes（🐴 爱马仕）这类 Agent 系统的开源国产平替，当然这个产品的能力不仅于此。感兴趣的可以去 liliMozi 的视频号里去了解下，她专门有出过一期视频来讲解。

AI Agent 概念

之前我在小宇宙听 “屠龙之术” 的主播庄明昊庄老师的一期播客里聊到：“如果你问现在身边人 AI Agent（智能体）是什么？大部分人的第一反应会是豆包”。

诚然，豆包是一款非常优秀的 AI 产品，也是我日常生活中的首选，它迄今为止已经有 1.4 亿的日活，非常厉害。但是，它不是 Agent（智能体），至少目前来看，它不是。它是 ChatBot（聊天机器人），它有强大的模型作为大脑，可以聊天，可以解答问题，可以提供情绪价值，但是它没有 “手”，不能实际地替我们干活。

Agent 是 2025 年开始火起来的一个词。什么是 Agent？我之前也经常在朋友圈里提。可以理解为你有一个助手，你交给它一个复杂任务，比如：“帮我调研今年 5 月份所有国内外大品牌项链的新品，将核心信息整理到我们团队的飞书表格里。” 于是它会自己明确目标，拆解可执行的子任务，确定行动步骤，然后调用打开浏览器的技能，自己开很多的标签进行搜索，全部检索完成后再进行总结，提取关键信息，再调用建飞书表格的技能，填充信息，最后做一遍自检，确认目标完成后再通知你。

有脑、有手、能自驱、能反思、能循环执行任务、有记忆、有性格，这就是 AI Agent。

养虾潮、养马潮

今年春节前后，OpenClaw 开始爆火，火得一塌糊涂。国内外出现了养虾潮，养虾潮还没褪去又出现了养马潮（Hermes）。它们的出现除了让技术圈外的人实实在在地体会到了 Agent 的神奇、魔幻和冲击外，也给技术圈的其他产品带来了新的启发，比如接入 IM 消息通道（比如飞书、微信、Telegram 等等），在手机上就可以控制自己电脑上的 Agent 工作、分层记忆策略、自进化技能…

但是它们的安装对非技术背景的人来说非常不友好，要解决一些开发环境的问题，需要懂一点点开发知识，不然之前也不会出现在闲鱼上有人 500 块钱上门帮安装这种魔幻的场景了。

上个月远程辅助广东的美女姐姐解决 Hermes 安装过程中的各种坑，比如在 Windows 上要装 WSL2 环境、要用命令行操作、有些地方配错了要手动去修改配置文件、要设置飞书机器人的各种权限钩子等等。

国产开源平替：OpenHanako

我喜欢有趣、有温度、上手简单的产品。深度体验了 Hanako 两天之后我觉得它符合我心目中的这些特性。

下载安装 Hanako

不需要你懂复杂的命令行，只需要去到官网引导的下载页，下载和你的环境匹配的包。

如果你是 Windows 系统，就下载 Windows-x64.exe；如果你是 MacOS 系统，Apple 系列芯片下载 macOS-arm64.dmg，Intel 系列芯片下载 macOS-x64.dmg。下载下来正常解压、安装就可以了。

配置模型

打开软件，第一步就会引导你配置模型。像国产现在的很多模型都是不错的，比如 GLM、Kimi、MiniMax、XiaoMi、QWen、DeepSeek 等等都是国产模型之光。当下这个时间点，我比较推荐 DeepSeek v4 Pro 这款模型，除了是最新出的模型之外，价格上也正在打 2.5 折，性价比很高。

选定了模型，然后去到这个模型所在的 API 平台充值、获取 API Key，再把 API Key 粘贴到 Hanako 的输入框里就可以了。这里不再赘述获取 API Key 的方法，问豆包、搜索引擎搜都可以。

配置 IM 消息通道

如果你想在手机聊天软件中就能控制你的 Hanako 的话，需要配置消息通道。Hanako 支持 QQ、微信、飞书、Telegram。我配的是微信和飞书。微信很简单，扫一下码就连上了，飞书比较麻烦一点，需要到飞书开发者后台新建一个机器人，获取到 AppId 和 AppSecret 这两个信息再粘回到 Hanako 上。

点击这里的立即创建，然后一路确定就可以了。然后你就会获取到 AppId 和 AppSecret 这里也不再赘述。配置完成之后你就能在飞书上找到你的助手了。

然后这个助手是运行在你的电脑上的，只要电脑不关机、不锁屏，你可以在任何地方联系到它让它帮你干活，比如：“帮我找到我电脑上今天要面试的后续人，读一下他们的简历，准备一些面试题”。

聊一聊 Hanako 的设计

为什么说 Hanako 是一款有温度的产品呢？我觉得作者在 GitHub 主页关于这个产品的介绍已经非常足够了：

”作为助手，Ta 是温柔的：不需要写复杂的配置，不需要理解晦涩的术语。Hanako 它不只面向 coder ，而是为每一个坐在电脑前工作的人设计的助手。作为工具，Ta 是强大的：记住你说过的每一件事，操作你的电脑，浏览网页，搜索信息，读写文件，执行代码，管理日程，还能自主学习新技能。“

除此之外，我很喜欢它干净的界面。“晴天模式” 一开，阳光下，树影摇曳，一张整洁的书桌上摆放着宣纸，得力助手在旁，和你一起协同创作。

还有一个我很喜欢的是它右侧的目录管理和文件编辑，Hanako 帮我创作完一篇草稿之后我可以直接在客户端里进行编辑。

Hanako 还有频道功能（把多个 Agent 拉到一起）、定时任务、笺（巡检任务）、跨会话的记忆、技能管理、Computer Use、安全沙箱、人格自定义等等功能。也非常期待 Hanako 未来有更多精彩的功能。

从技术点看 Hanako 的功能

因为我现在也正在系统学习 Agent 的知识，下午让我拆解了一下 Hanako 的源码，后续也会陆续在这个公众号里分享我的学习成果。

1. 多 Agent 管理

每个 Agent 是独立实例，有自己的目录、配置、人格、记忆、session、书桌和定时任务。Agent 的唯一身份来自目录名，核心数据放在 ${HANA_HOME}/agents/{agentId} 下。支持创建、删除、切换、设为主 Agent、排序、头像、人格文件、意识文件、公开意识、置顶记忆和经验配置等。

2. 人格与身份系统

每个 Agent 有 identity.md、ishiki.md、yuan.md 等文件参与 prompt 组装。项目内置多套模板，例如 hanako、ming、butter、kong 等，并支持中英文模板。用户可以在设置里改 Agent 的身份、人设、意识、头像等。

3. 长期记忆系统

记忆不是简单拼接历史消息，而是多层流水线：

• 每 6 轮对话触发滚动摘要。
• session 结束时做 final summary。
• 每日任务会编译 today.md、week.md、longterm.md、facts.md。
• 最终 assemble 成 memory.md 注入系统 prompt。
• 深度记忆进入 facts.db，通过标签和 FTS5 全文搜索检索。
• 支持 session 级记忆开关和 agent 级总开关。

4. 聊天与 session 管理

支持新建、切换、重命名、归档、恢复、删除 session，session 使用 JSONL 存储。桌面端首次进入可以不立即创建 session，而是等用户首次发送消息时创建。还支持浏览器 session 管理、标题缓存、session 元数据、工具快照、权限模式、thinking level、上下文压缩保护等。

5. 工具能力

Agent 内置工具覆盖：

• 文件读写、编辑、grep、find、ls、bash。
• Web 搜索、网页 fetch / reader。
• todo 管理。
• cron 定时任务。
• stage files / artifact 文件输出。
• channel 群聊工具。
• DM 工具。
• browser 工具。
• computer use 工具。
• install skill 工具。
• notify 工具。
• update settings 工具。
• subagent 委派工具。
• check deferred / wait / stop task / current status。

这些工具被汇总成 Agent 的工具快照，再由 Engine 统一包装沙盒、checkpoint 和 session permission。

6. 安全沙盒与权限

工具执行时会经过双层保护：

• 应用层 PathGuard：限制读写范围。
• OS 级沙盒：macOS Seatbelt、Linux Bubblewrap；Windows 走 PathGuard + win32 exec。
• 保护 auth.json、models.json、added-models.yaml、浏览器数据等敏感路径。
• 工作区、Agent 记忆、书桌、session、uploads 等有明确读写策略。
• 文件写操作还可以接入 checkpoint 备份。
• session permission wrapper 可在运行期做确认和权限控制。

7. 书桌 Desk

每个 Agent 有自己的 desk，支持放文件、写笺、查看文件、搜索文件、拖拽上传、预览、活动记录、heartbeat 巡检、cron 任务。书桌和记忆系统是独立模块，适合作为用户与 Agent 的异步协作空间。

8. 定时任务与心跳

Hub 的 Scheduler 负责 heartbeat 与 cron。Agent 可以定时巡检书桌、执行周期任务；cron/heartbeat/channel 这类任务通过 Hub 的 ephemeral 路由进入 isolated execution，不污染普通聊天 session。

9. 多 Agent 协作

支持频道 channel 和 DM。频道可有多个 Agent 成员，ChannelRouter 做消息 triage 和调度；DM 用于 Agent 之间私聊或用户与特定 Agent 交互；subagent 工具支持从主会话派出后台任务，并通过 deferred result 返回结果。

10. 外部平台 Bridge

支持 Telegram、飞书、QQ、微信机器人接入。每个平台一个 adapter，共享外部消息执行路径。Bridge 处理 owner/guest 身份、群聊、私聊、媒体下载、媒体发送、流式消息清洗、平台能力差异和本地文件投递。

11. 媒体与 SessionFile

用户可见文件通过 SessionFile sidecar 统一登记。桌面端、Bridge、插件和未来移动端消费同一套文件身份。图片、SVG、视频可在聊天或书桌中全屏查看，支持缩放、拖拽、快捷键和相邻媒体切换。

12. 浏览器与网页能力

项目有 browser manager、browser viewer、browser tool。桌面端使用 Electron 的 WebContentsView 管理浏览器视图；Agent 可通过浏览器后端搜索、查看网页、截图、检查页面内容。

13. Computer Use

支持通过 computer_use 工具操作电脑。架构上抽象为 ComputerHost + ProviderRegistry，平台 provider 包括 macOS CUA、Windows UIA、mock provider，并有 lease / approval / model policy 等机制。桌面端有 ComputerUseOverlay 和设置页控制开关与权限。

14. 模型与 Provider 管理

支持多 Provider、多模型、OAuth、本地 Ollama、OpenAI-compatible、Anthropic 风格协议等。内置 Provider 包括 OpenAI、Anthropic、DeepSeek、Gemini、OpenRouter、Ollama、DashScope、Volcengine、Moonshot、Zhipu、Groq、Together、Mistral、Perplexity、xAI 等。模型配置统一由 ProviderRegistry、ModelManager、ExecutionRouter 处理。

15. Skills 系统

支持内置 skills、用户安装 skills、Agent learned skills、外部兼容 skills、workspace skills、插件 skills。会做 per-agent 隔离、运行时过滤、watch 自动 reload。兼容 Claude Code / Codex / OpenClaw / Pi / Agents 等外部技能目录。

16. 插件系统

插件是很完整的一等扩展机制，支持：

• tools
• skills
• slash commands
• agent templates
• HTTP routes
• providers
• Pi SDK extensions
• lifecycle index.js
• settings tab
• page
• widget
• configuration schema
• event bus

权限分 restricted 和 full-access。restricted 可贡献工具、技能、命令、Agent 模板、配置和有限 bus；full-access 可注册路由、provider、extension、生命周期和 bus handler。内置插件包括 image-gen 和 mcp。

17. 内置插件

plugins/image-gen 提供图片/视频生成任务，内置 OpenAI 与火山引擎适配器，支持后台 poller、任务存储、生成文件登记、任务取消。plugins/mcp 提供 MCP Connectors，作为隐藏系统插件加载，设置页贡献 Connectors tab。