乐于分享
好东西不私藏

GBrain:让AI Agent拥有完美记忆的知识系统

GBrain:让AI Agent拥有完美记忆的知识系统

Y Combinator总裁Garry Tan开源的”数字大脑”,能否成为AI助手的关键基础设施?

缘起:一个困扰AI的古老问题

“我Agent经常忘记半小时前说了什么。”

这个看似简单的问题,却是当前AI助手发展最大的瓶颈之一。当我们在与AI对话时,每次都是全新的开始——没有记忆累积,没有知识沉淀,更谈不上智能的进化。

直到Garry Tan在Twitter上扔下了一枚重磅炸弹:

“如果你想让你的OpenClaw或HermesAgent能够完美记忆所有10,000+个markdown文件,GBrain来帮忙了。这正是我的OpenClaw/HermesAgent设置。MIT开源许可。希望能帮助你构建你的迷你AGI。”

这条推文在短短24小时内获得了惊人的3603个赞381次转发,整个AI社区为之震动。

GBrain是什么?

简单来说,GBrain是Vannevar Bush在1945年构想的”Memex”的现代实现——一个为思考者而生的数字大脑。

但理解GBrain,更需要了解它诞生的背景:

Garry Tan的数字大脑实验

Garry Tan,作为Y Combinator的总裁,开始为自己的OpenClaw Agent构建一个markdown知识库。他采用了一个简单的原则:

  • • 每人一页文档
  • • 每家公司一页文档
  • • 顶部是与时俱进的编译真理
  • • 底部是只追加的时间线

这个简单的模式产生了惊人的效果。Agent知道得越多,就越聪明。于是Garry不断”喂养”它:

  • • 会议记录
  • • 邮件往来
  • • Twitter内容
  • • Apple Notes
  • • 日历数据
  • • 原创想法

仅仅一周时间,他的数字大脑就达到了令人震惊的规模:

10,000+ markdown文件被索引和搜索
3,000+ 人物档案和关系历史
13年 的日历数据(21,000+事件)
5,800+ Apple Notes(追溯到2009年)
280+ 会议记录和AI分析
300+ 组织化的原创想法
500+ 媒体页面(视频转录、书籍、文章)

这不仅仅是理论,而是Garry每天真正在使用的系统。Agent在他睡觉时持续运行……字面意义上的”梦境循环”会扫描当天的每次对话,丰富缺失的实体,修复损坏的引用,整理记忆。

第二天早上,大脑比他入睡时更聪明了。

为什么需要Postgres?

当有500个文件时,grep就够了。但当有3,000个人物页面、5,800个Apple Notes和13年的日历数据时,grep就崩溃了。

你需要:

  • • 关键词搜索——精确查找人名
  • • 向量搜索——语义匹配
  • • 融合算法——两者结合

你需要一个能够毫秒级找到”三月份参加董事晚宴的所有人”的索引,而不是30秒的grep等待。

GBrain提供了混合搜索,结合了关键词和向量方法,以及一个将每个页面都视为情报评估的知识模型:

  • • 顶部的编译真理(当前最佳理解,随证据更新而重写)
  • • 底部的时间线(永不编辑的证据轨迹)

复合增长的威力

大多数工具只是帮助你找到东西。GBrain让你随着时间的推移变得更聪明。

其核心循环是:

信号到达(会议、邮件、推文、链接)
  → Agent检测实体(人物、公司、想法)
  → 读取:先检查大脑(gbrain搜索、gbrain获取)
  → 带着完整上下文回应
  → 写入:用新信息更新大脑页面
  → 同步:gbrain为下次查询索引更改

每次通过这个循环都会增加知识。Agent在会议后丰富人物页面。下次这个人出现时,Agent已经有了上下文——他们的角色、你们的历史、他们关心什么、上次讨论了什么。你永远不需要从零开始。

没有这个循环的Agent从过时的上下文中回答。拥有这个循环的Agent每次对话都会变得更聪明。差异每天都在复合增长。

你可以用GBrain做什么?

Garry Tan展示了一些令人印象深刻的使用场景:

“谁认识Pedro和Diana,我应该邀请谁来晚宴?”
—— 跨3,000+个人物页面引用社交图谱

“我对羞耻感和创始人表现之间的关系说过什么?”
—— 搜索的是你的思考,而不是互联网

“自周二以来,A轮融资有什么变化?”
—— 跨交易和公司页面对比时间线条目

“30分钟后跟Jordan的会议准备”
—— 拉取档案、共同历史、近期活动、开放话题

这个系统不仅仅是搜索工具,它是真正意义上的”第二大脑”。

社区的反响

Garry的开源引发了AI社区的激烈讨论:

SelanVeydris

“我们基本上正在从无状态提示转向持久记忆系统。像Engraph这样的工具在这里很有趣——它们将原始笔记/数据转化为结构化、可查询的记忆层,Agent可以在其上累积构建。感觉真正的解锁不是更好的提示,而是更好的记忆。🧠”

vishalojha_me

“我把它扔给Claude进行完整审查。仅梦境循环就值得这个星标。无状态Agent是死路一条,这是缺失的持久层。”

mrsharma

“Garry这太棒了!!通过3个阶段添加到我的OpenClaw中,砰!”

许多开发者询问了与其他工具的兼容性、性能对比以及实际部署成本等问题,显示出强烈的实际应用兴趣。

技术架构深度解析

知识模型

每个大脑页面都遵循”编译真理 + 时间线”模式:

---
type: concept
title: Do Things That Don't Scale
tags: [startups, growth, pg-essay]
---


Paul Graham认为,创业公司早期应该做不可扩展的事情。
最常见的是手动一个一个招聘用户。Airbnb挨家挨户
在纽约为公寓拍照。Stripe为早期用户手动
安装他们的支付集成。

关键见解:不可扩展的努力教会了你用户真正
想要什么,这是你无法通过其他方式学到的。

---

-
 2013-07-01: 发布于paulgraham.com
-
 2024-11-15: 在W25启动会议中被引用
-
 2025-02-20: 在关于AI Agent入职策略的讨论中被引用

---分隔符上方:编译真理。你当前的最佳理解。当新证据改变图景时会被重写。下方:时间线。只追加的证据轨迹。只被添加,从不编辑。

编译真理是答案。时间线是证明。

搜索机制

只使用关键词搜索会错过概念匹配。”忽略传统智慧”找不到名为”天才巴士票理论”的文章,尽管这完全就是关于那个主题。只使用向量搜索会在嵌入被周围文本稀释时错过精确短语。RRF融合两者都对。多查询扩展捕捉你没想到了的表述。

与OpenClaw/Hermes的集成

GBrain是世界知识——人物、公司、交易、会议、概念、你的原创思考。它是你对世界了解的长期记忆。

OpenClaw agent内存(memory_search)是操作状态——偏好、决策、会话上下文、Agent应该如何表现。

它们是互补的:

存储什么
如何查询
gbrain
人物、公司、会议、想法、媒体
gbrain search

gbrain querygbrain get
Agent内存
偏好、决策、操作配置
memory_search
会话上下文
当前对话
(自动)

所有三层都应该被检查。GBrain用于关于世界的事实。内存用于Agent配置。会话用于直接上下文。

实际部署指南

先决条件

没有Postgres,你现在就可以使用GBrain知识模型:技能、模式和编译真理 + 时间线模式适用于任何读取和写入markdown文件的Agent。当grep不再足够时再添加Postgres。

使用Postgres时,GBrain需要三样东西:

依赖
用途
获取方式
Supabase账户
Postgres + pgvector数据库
supabase.com (专业版, $25/月)
OpenAI API密钥
嵌入(text-embedding-3-large)
platform.openai.com/api-keys
Anthropic API密钥
多查询扩展 + LLM分块(Haiku)
console.anthropic.com

安装步骤

对于OpenClaw或HermesAgent用户(推荐):

将gbrain (https://github.com/garrytan/gbrain) 设置为我的
知识大脑。

1. 确保bun已安装:
   curl -fsSL https://bun.sh/install | bash
   然后运行:bun add github:garrytan/gbrain

2. 运行:gbrain init --supabase
   (按照向导连接我的Supabase数据库)

3. 扫描 ~/git/ 和 ~/Documents/ 中的markdown仓库,
   选择最好的一个,然后运行:gbrain import <path> --no-embed

4. 对导入的数据运行查询以证明搜索有效

5. 阅读docs/GBRAIN_RECOMMENDED_SCHEMA.md并提议
   重构我的知识库

6. 阅读docs/GBRAIN_SKILLPACK.md并用生产Agent模式
   更新所有你的技能:大脑-智能体循环、
   实体检测、来源归属、铁法则反向链接、
   和增强管道

7. 为`gbrain check-update`设置每日cron。
   只在新功能时通知我,而不是补丁。
   永不自动安装,只告诉我有什么新功能。

8. 设置自动同步,使向量数据库与
   大脑仓库保持最新。阅读GBRAIN_SKILLPACK.md第18节
   了解方法(cron、--watch、webhook)。选择适合
   你环境的。总是链式:
   gbrain sync --repo <path> && gbrain embed --stale
   验证:推送更改,确认它出现在搜索中。

9. 运行验证手册(docs/GBRAIN_VERIFY.md)
   确认一切正常:模式、同步、嵌入、
   大脑优先查找。

快速体验

GBrain不附带演示数据。它发现你的markdown并使其可搜索。

第一幕:发现 GBrain扫描你的机器寻找markdown仓库:

=== GBrain环境发现 ===

  ~/git/brain (2.3GB, 342 .md文件, 87个二进制文件)
    类型:纯markdown(准备好导入)

  ~/Documents/obsidian-vault (180MB, 1,203 .md文件, 0个二进制文件)
    类型:Obsidian仓库(可用wikilink转换)

=== 发现完成 ===

第二幕:导入 你的文件从仓库移动到Supabase。

gbrain import ~/git/brain/
# 导入342个文件到Supabase(1,847个块)。后台嵌入中...


gbrain stats
# 页面:342, 块:1,847, 已嵌入:0(嵌入中...), 链接:0

第三幕:搜索 Agent从你的实际内容中选择一个查询。

# Agent读取你的语料库并选择相关查询
gbrain query "我们对竞争动态了解多少?"
# 3个结果,通过混合搜索评分(向量 + 关键词 + RRF融合)


# 30秒后,嵌入完成:

gbrain stats
# 页面:342, 块:1,847, 已嵌入:1,847, 链接:0


# 现在语义搜索也上线了

gbrain query "我们现在的最大风险是什么?"
# 通过意义而不是关键词找到关于护城河、董事会准备和战略的页面

你的文件数量会不同。你的查询会不同。Agent根据导入的内容选择它们。这正是重点:这是你的大脑,不是演示。

未来展望

GBrain代表了一个重要的范式转变:从无状态的AI助手到拥有持久记忆和持续学习能力的智能体。

正如社区成员所指出的,我们正在从”更好的提示”转向”更好的记忆”。这可能是AI发展到AGI的关键一步。

Garry Tan的开源举动,为整个AI社区提供了一个成熟的参考实现。这不仅是一个工具,更是一个完整的知识管理系统——从数据模型、搜索算法到Agent技能包的完整解决方案。

对于那些想要在中长期内保持竞争力的AI开发者来说,理解并实施类似的知识管理系统,可能是下一个重要的发展方向。

结语

当大多数人都还在讨论prompt engineering时,Garry Tan已经构建了一个每天都在变聪明的系统。GBrain告诉我们,真正的AI助手需要的不是更聪明的算法,而是更好的记忆。

这种知识的复合增长效应,正是通往更强大AI的关键路径。现在,这个路径向每个人开放。


相关链接:

  • • GBrain GitHub: https://github.com/garrytan/gbrain

如果你对构建自己的知识大脑感兴趣,或者想了解GBrain在你的项目中的应用,欢迎关注公众号「光影织梦」,给我们留言交流。