关于OpenHuman、记忆树,以及AI代理赛道的冷与热

OpenHuman桌面端产品主视觉
你有没有这种感觉
用了半年AI助手,它还是不认识你。每次打开新对话,重新介绍自己,重新解释项目,重新说明偏好。它有工具、有能力,就是没有记忆。
5月的第三个周末,GitHub上冒出个项目,直接把这个痛点推上了热榜第一。它叫OpenHuman,由Tiny Humans AI团队开发。
你可能见过这两天刷屏的AI项目,给AI工具链装尾巴的、给大模型接各种各样的家的。OpenHuman和他们不一样。它的野心更大,让AI助手在几十分钟内了解你。
截至5月20日,OpenHuman在GitHub上已获得21.8k星。只花了一个周末就破了1万星。作为对比,OpenClaw拿到第1万星花了62天,HERMES花了10天。项目累计1737次提交,发布31个版本,从安装到可用只需几分钟。连续登顶GitHub Trending榜首,一天涨星超过1000。OpenHuman使用GNU通用公共许可证版本3。Product Hunt精选推荐,X和Reddit上讨论不断。
为什么是OpenHuman
开源社区刷榜的项目不少。OpenHuman的特别之处,在于它找问题的角度和别人完全不同。
很多人吐槽AI助手像金鱼,七秒记忆,聊完就忘。其实还有三个更深的痛点没人认真解决:每次开新对话都要从头训起;你的邮件在Gmail、代码在GitHub、笔记在Notion、聊天在Slack,让AI怎么联得起来;更糟的是,敏感数据不敢给云端,怕泄露。
OpenHuman直接从根上解决问题。
它背后的团队tinyhumansai给自己下了个定义:一个专注于创建接近人工意识的AI算法的AI实验室。团队创始人此前给父亲安装开源AI代理时折腾了三个小时,在API密钥、YAML配置文件、不认识的终端里挣扎,最后两人都放弃了。那天的挫败感让他下定决心:今天每一个强大的AI代理,都是为那0.01%能自己搭环境的人设计的,剩下99.99%只能站在场边围观这场代理革命。
所以他们的产品理念不是简单做一个聊天框,而是直接把大模型、工具调用、长期记忆、第三方软件连接和本地文件能力全放进一个桌面应用里。官方定义是:一个完整的桌面端个人AI系统。性能层面,OpenHuman采用Rust占比约69.7%搭配TypeScript和Tauri的组合,替代主流的Electron,设计之初就把性能和低内存占用作为优先考量。
这个选择本身就是一种表态。Electron方案意味着内嵌Chromium,安装包大、内存占用高。Tauri用原生WebView替代,应用启动更快、包体更小。Rust作为核心语言确保内存安全和高性能,但也意味着贡献门槛更高,不是随便一个前端开发者就能上手改代码的。
连接、抓取、记忆树:三步让你被AI记住
OpenHuman的核心是三步走:连接、抓取、记忆树。
第一步:连接
它支持118+第三方服务一键授权,包括Gmail、Notion、GitHub、Slack、Stripe、Google Calendar、Google Drive、Linear、Jira等。关键是不需要手动配API Key,点一下授权就行。系统还在持续扩展,开发者方面包括GitHub、GitLab、Bitbucket,团队协作有Slack、Teams、Discord,项目管理有Jira、Trello、Asana、Linear。这才是面向普通人的设计。

118+应用一键OAuth授权连接
第二步:自动抓取
授权后,核心引擎每20分钟自动轮询所有连接的账户,新邮件、日程变更、代码提交、文档更新,统统拉到本地存储。
第三步:记忆树
所有数据经过清洗压缩,切分成不超过3000词元的Markdown片段,打分后构建层次化的摘要树,存放在本地SQLite数据库里。同时同一份数据会同步生成可在Obsidian中打开浏览的.md文件。
这里值得多说两句。记忆树不是传统意义上的向量数据库。它的设计借鉴了人类分层记忆的思路,产生三种不同粒度的树:来源树,每个数据源拥有独立的滚动缓冲区,按L0到L2层级密封,适合回溯某个Gmail标签或Slack频道的完整时间线;主题树,基于热度算法为高频实体构建摘要树,适合追踪某个项目、人物或关键词的演变;全局树,每日UTC时间生成全局摘要,适合回答今天发生了什么这类跨源问题。
浅层节点捕获高层概要,深层节点保留细粒度细节。Embeddings仍然存在于节点中以支持语义搜索,但树状结构让记忆具备可解释性,不再是碎片化的相似度匹配。

记忆树三层架构:来源树、主题树、全局树
这个设计灵感来自前特斯拉AI总监Andrej Karpathy的工作流。Karpathy在2026年4月提出的LLM Knowledge Base概念,核心是用Markdown文件构建个人知识库。但他的问题是全程手动,自己整理Markdown、自己分类、自己更新,一天不维护知识库就过期。OpenHuman把整个手工过程变成了全自动生产线。
三层规则叠加保证了灵活度:内置默认规则、用户自定义规则、项目级规则,全以JSON文件存储,改了不需要重新编译。
记忆树有一个真正独特的性质:AI记住的一切你都可以看见。如果记错了,直接用Obsidian打开对应的文件手动改。这在当前AI代理领域几乎找不到第二个。其他方案的记忆要么是黑盒向量库,要么是聊天历史的简单摘要,用户无法审查、无法编辑、无法理解AI为什么记住了这个而不是那个。OpenHuman把记忆变成了一个人类可读的知识库,这个设计决策背后的直觉是:如果用户不能理解和修正AI的记忆,那所谓的长期记忆就是不完整的。
TokenJuice和桌面吉祥物
OpenHuman有两个容易被忽视但很聪明的设计。
TokenJuice智能压缩
每个工具调用结果、网页抓取内容、邮件正文等,在送入大模型前会先经过压缩:HTML转Markdown、长URL缩短、冗余内容剔除、去重优化,同时完整保留中文和emoji等字符。官方数据表明最多可降低80%的响应延迟和词元消耗。
80%这个数字需要拆开看。PrimeAI Labs做了一个独立测试:同一个查询,跨GitHub和Notion汇总最近30天的项目活动,原始API调用拉了大约48000个token,经过TokenJuice处理后降到约14200个token,实际压缩率约70%。不到80%,但绝对显著。在没有压缩的情况下,让前沿模型扫六个月的邮件可能单次就要花20到30美元;有TokenJuice,同样的操作大概是个位数美元。
不过压缩技术本身存在一个权衡。代码片段、合同条款、时间戳这类信息,过度压缩可能改变语义或丢失关键证据。CSDN上有分析建议采取分级策略:邮件笔记高压缩,合同代码低压缩或无压缩。OpenHuman目前还没有提供细粒度的压缩级别控制,这是一个有待完善的地方。
桌面吉祥物
一个可视化的小形象,会说话、能对环境做出反应,甚至可以作为一个真实参与者加入谷歌会议。它还能跨周记住用户信息,后台持续思考,即使你停止输入它仍在运行。
吉祥物不是噱头。从产品心理学角度看,一个有表情、有声音、会反应的桌面存在,和终端窗口里一行行滚动的文字,给用户的信任感和陪伴感完全不同。OpenHuman的创始人用了一个很直接的表达:agent应该有一张脸。这张脸让用户愿意把更多工作交给它,愿意让它常驻后台,愿意长期使用。在Agent弃养潮蔓延的2026年,降低弃养率的不是一个更长的功能清单,而是一种不同的关系感。
吉祥物在Google Meet中的实现也值得一提。它不是简单的录音机器人,而是通过Rust编写的camera bridge,把吉祥物的动画帧作为虚拟摄像头的输出注入到Meet的出站视频流中。音频桥接则通过Chrome DevTools Protocol控制Meet的页面级音频。mascot在会议中可以实时说话、做唇形同步,同时后台AI在转录和分析会议内容。
此外,模型路由功能让推理任务自动匹配推理模型,快速响应匹配快速模型,图片理解匹配视觉模型。PrimeAI Labs的测试数据显示:从记忆树中简单召回用本地Gemma3 1B模型平均1.2秒,跨源摘要用Claude Sonnet 4.6平均4.8秒,邮件起草用GPT-5.5平均3.9秒。当然,你也可以通过Ollama接入本地模型,敏感任务跑在自己机器上。
虾、马、人:AI代理赛道的三种解法

AI代理赛道三强:虾、马、人
AI代理赛道有几个标志性项目。
OpenClaw累计37.2万GitHub星,通过广泛的插件生态和50多个消息平台连接打天下。HERMES Agent走深度优先路线,闭环学习让它在执行复杂任务后能自我更新技能包,累计15.3万星。OpenHuman和他们最大的差别首先在门槛上。
很多AI代理早期默认面向macOS或服务器用户,OpenHuman从一开始就给Windows用户提供了原生安装包。这不是小事。Windows才是更大的桌面市场,如果能把Windows体验跑顺,OpenHuman就不只是服务程序员,而是在把代理往普通办公人群里推。
其次是模型调用方式。OpenClaw和HERMES更像BYOK工具,你要用就得自己去准备OpenAI、Anthropic等的API Key。OpenHuman不仅支持用户用别人的API,还准备了自有的专用模型,强调自己的模型更省词元。创始人给出的逻辑是:别人的模型只是具备了agent能力,而OpenHuman的模型生来就是为了agent准备的,所以自然更便宜。这个说法有一定道理,但也意味着用户对模型选择的自由度相对较低。
第三是集成广度。OpenClaw由开发者维护插件生态,HERMES做多供应商拼接,Claude Cowork连接器极少。OpenHuman是目前开源里集成数量最多的选手,118+服务一键接入。
第四是激活成本。HERMES要观察你工作几天甚至几周才能积累有用上下文,OpenClaw要靠插件慢慢搬运信息。OpenHuman直接跳过等待期,连接完账户,auto-fetch功能每20分钟拉一次数据,装好当天就能用。
最后是记忆的可编辑性。这是OpenHuman最独特的地方。AI记住的一切你都可以看见,如果记错了,直接用Obsidian打开对应的文件手动改。
但这个对比也需要打一个补丁。OpenClaw的插件生态和50+消息平台覆盖,是OpenHuman目前无法比拟的。HERMES的自学习循环让它在长期使用中可能越来越聪明,而OpenHuman的记忆本质上是对已有信息的压缩和结构化,不是从行为中学习。三种方案各有取舍,OpenHuman的优势在于冷启动速度和记忆的可审查性,劣势在于生态深度和学习能力的上限。
越像操作系统,风险越大
36氪在一篇体验文中提出了一个关键问题:越用越后怕。
这个后怕不是没有道理的。当OpenHuman把118个服务的账号全部接入、每20分钟把你的完整数字生活拉到本地,它实际上在你的电脑上构建了一个极其完整的个人数据图谱。邮件内容、代码变更、财务信息、日程安排、聊天记录,全部集中在一个地方。
数据存在本地,比存在云端更安全吗?理论上是的。本地优先的架构意味着你的数据不会上传到OpenHuman的服务器。但安全是相对的。一旦本地系统被攻破,攻击者获取的不是单一应用的数据,而是你整个数字生活的完整图景。这比单个Gmail账号泄露的后果严重得多。
思科在一份安全报告中把OpenClaw形容为从安全角度看绝对是一场噩梦。OpenHuman虽然把数据放在本地,但攻击面的逻辑是一样的:接入的服务越多,集中存储的数据越完整,一旦出问题影响就越大。
OpenHuman还有一个更微妙的隐私问题:模型路由意味着你的数据会被发送到不同的云端模型提供商。TokenJuice在发送前做了压缩,但压缩后的内容仍然包含你的工作上下文。对于特别敏感的工作负载,本地Ollama模型是一个可选的替代方案,但这又回到了那0.01%和99.99%的问题,普通用户大概率不会去配置本地模型。
创始人对开源有非常务实的判断。现代人每天的工作流光是窗口切换可能一天就能浪费掉两小时,而现有的解决方案都只解决了一半。他的解决方案简单粗暴:不说教、不预设、不让人花时间适应机器,而是让机器主动适应人。
他在产品里做的三个决定尤其值得一提。第一,Windows优先。传统的AI代理默认面向macOS开发者,但Windows才是更大的桌面市场。第二,安装包不用终端。直接下载、双击、下一步、完成。第三,不给开发者做玩具,给普通人做工具。0.01%能自己搭环境的人和剩下99.99%在场边观望的人,他选了后者。
OpenHuman早期测试版体验仍然不够完美。截至5月19日,产品还在快速迭代中,v0.54.0刚刚发布,GitHub上有用户反馈在Windows上运行时每2秒弹出透明窗口的问题已被修复。记忆树的跨源冲突处理机制尚未详细说明,当Gmail中的信息与Notion中的信息矛盾时,树结构如何决定优先级?热度算法的细节未公开,用户难以理解和调优。这些都说明还有大量的优化空间。
虾退热之后

AI代理赛道2026:技术热度和用户留存的冰火两重天
当我们把注意力从某某公司融了几十亿转移到OpenHuman时,会看到一些更本质的趋势。
2026年被很多人称为AI代理元年。Gartner预测到今年底将有40%的企业应用嵌入任务型AI智能体,中国企业级AI智能体市场规模将突破480亿元。
但数字之下是另一番景象。量子位的观察指出了一个关键反差:2026年代理赛道,OpenClaw、HERMES、OpenHuman等技术框架密集迭代,开发者热情高涨,但用户端弃养潮蔓延,技术演进与用户留存严重脱节。
EvoMap创始人在量子位AIGC2026圆桌论坛上说了个大实话:C端用户在慢慢流失。这里说的C端是完全没有编程基础、也不指望Agent做什么的人。让他用OpenClaw、用Opus 4.7,可能只问今天天气怎么样,这属于算力浪费。而Token大户,一个月消耗五六万美金Token的人,在往B端和D端走。
Foundation Capital那篇广为流传的Context Graphs文章指向了同一个判断:Agent公司真正的护城河不在框架本身,而在执行过程中沉淀下来的决策经验。光搭一个壳是不够的,能沉淀know-how才有壁垒。
OpenHuman的特别之处在于它从一开始就想的是留存问题。不是做得更复杂,而是让普通人也能用上。它不是在框架层面和OpenClaw、HERMES卷迭代速度,而是在产品层面解决一个更根本的问题:用户为什么愿意留下来。
一个有记忆的AI助手,和一个没有记忆的AI助手,不是程度上的差别,是种类上的差别。前者你能和它建立长期关系,后者你只是偶尔想起来才打开。OpenHuman引爆的这个趋势,或许比任何一个几十亿美元的融资更值得关注。
但它能不能真正留住人,不取决于GitHub上有多少星,而取决于那个黄色小吉祥物能不能让一个不懂代码的人觉得:这东西真的在帮我,我离不开它了。
这一点,2026年还没人能给出答案。
参考来源
1. 知乎专栏《19.2K Star!这个开源 AI 桌面助手,真的记住你这个人了》,2026年5月22日
2. 36氪《OpenHuman刷屏硅谷,开源、免费、能接100多个应用,但我越用越后怕》,2026年5月18日
3. EEworld《After Shrimp Horse, another hot topic! OpenHuman learns everything about you in 20 minutes》,2026年5月16日
4. CSDN《OpenHuman 深度剖析:让 AI 成为真正懂你的桌面级智能体》,2026年5月21日
5. 搜狐《虾、马之后,人类登场!这个霸榜GitHub项目火了》,2026年5月19日
6. 电子发烧友《热度洗牌!AI Agent赛道黑马杀出》,2026年5月20日
7. TechTimes《The Agent That Reads You First: OpenHuman Tops GitHub Trending》,2026年5月16日
8. PrimeAI Labs《OpenHuman Review 2026》,2026年5月17日
9. 量子位《龙虾养不动了?周鸿祎给虾搭了个云端办公室》,2026年5月22日
10. GitHub官方README,tinyhumansai/openhuman项目,截至2026年5月
夜雨聆风