GBrain:让AI Agent拥有完美记忆的知识系统-夜雨聆风

GBrain:让AI Agent拥有完美记忆的知识系统

Y Combinator总裁Garry Tan开源的”数字大脑”，能否成为AI助手的关键基础设施？

缘起：一个困扰AI的古老问题

“我Agent经常忘记半小时前说了什么。”

这个看似简单的问题，却是当前AI助手发展最大的瓶颈之一。当我们在与AI对话时，每次都是全新的开始——没有记忆累积，没有知识沉淀，更谈不上智能的进化。

直到Garry Tan在Twitter上扔下了一枚重磅炸弹：

“如果你想让你的OpenClaw或HermesAgent能够完美记忆所有10,000+个markdown文件，GBrain来帮忙了。这正是我的OpenClaw/HermesAgent设置。MIT开源许可。希望能帮助你构建你的迷你AGI。”

这条推文在短短24小时内获得了惊人的3603个赞和381次转发，整个AI社区为之震动。

GBrain是什么？

简单来说，GBrain是Vannevar Bush在1945年构想的”Memex”的现代实现——一个为思考者而生的数字大脑。

但理解GBrain，更需要了解它诞生的背景：

Garry Tan的数字大脑实验

Garry Tan，作为Y Combinator的总裁，开始为自己的OpenClaw Agent构建一个markdown知识库。他采用了一个简单的原则：

• 每人一页文档
• 每家公司一页文档
• 顶部是与时俱进的编译真理
• 底部是只追加的时间线

这个简单的模式产生了惊人的效果。Agent知道得越多，就越聪明。于是Garry不断”喂养”它：

• 会议记录
• 邮件往来
• Twitter内容
• Apple Notes
• 日历数据
• 原创想法

仅仅一周时间，他的数字大脑就达到了令人震惊的规模：

10,000+ markdown文件被索引和搜索
3,000+ 人物档案和关系历史
13年 的日历数据（21,000+事件）
5,800+ Apple Notes（追溯到2009年）
280+ 会议记录和AI分析
300+ 组织化的原创想法
500+ 媒体页面（视频转录、书籍、文章）

这不仅仅是理论，而是Garry每天真正在使用的系统。Agent在他睡觉时持续运行……字面意义上的”梦境循环”会扫描当天的每次对话，丰富缺失的实体，修复损坏的引用，整理记忆。

第二天早上，大脑比他入睡时更聪明了。

为什么需要Postgres？

当有500个文件时，grep就够了。但当有3,000个人物页面、5,800个Apple Notes和13年的日历数据时，grep就崩溃了。

你需要：

• 关键词搜索——精确查找人名
• 向量搜索——语义匹配
• 融合算法——两者结合

你需要一个能够毫秒级找到”三月份参加董事晚宴的所有人”的索引，而不是30秒的grep等待。

GBrain提供了混合搜索，结合了关键词和向量方法，以及一个将每个页面都视为情报评估的知识模型：

• 顶部的编译真理（当前最佳理解，随证据更新而重写）
• 底部的时间线（永不编辑的证据轨迹）

复合增长的威力

大多数工具只是帮助你找到东西。GBrain让你随着时间的推移变得更聪明。

其核心循环是：

信号到达（会议、邮件、推文、链接）
  → Agent检测实体（人物、公司、想法）
  → 读取：先检查大脑（gbrain搜索、gbrain获取）
  → 带着完整上下文回应
  → 写入：用新信息更新大脑页面
  → 同步：gbrain为下次查询索引更改

每次通过这个循环都会增加知识。Agent在会议后丰富人物页面。下次这个人出现时，Agent已经有了上下文——他们的角色、你们的历史、他们关心什么、上次讨论了什么。你永远不需要从零开始。

没有这个循环的Agent从过时的上下文中回答。拥有这个循环的Agent每次对话都会变得更聪明。差异每天都在复合增长。

你可以用GBrain做什么？

Garry Tan展示了一些令人印象深刻的使用场景：

“谁认识Pedro和Diana，我应该邀请谁来晚宴？”
—— 跨3,000+个人物页面引用社交图谱

“我对羞耻感和创始人表现之间的关系说过什么？”
—— 搜索的是你的思考，而不是互联网

“自周二以来，A轮融资有什么变化？”
—— 跨交易和公司页面对比时间线条目

“30分钟后跟Jordan的会议准备”
—— 拉取档案、共同历史、近期活动、开放话题

这个系统不仅仅是搜索工具，它是真正意义上的”第二大脑”。

社区的反响

Garry的开源引发了AI社区的激烈讨论：

SelanVeydris：

“我们基本上正在从无状态提示转向持久记忆系统。像Engraph这样的工具在这里很有趣——它们将原始笔记/数据转化为结构化、可查询的记忆层，Agent可以在其上累积构建。感觉真正的解锁不是更好的提示，而是更好的记忆。🧠”

vishalojha_me：

“我把它扔给Claude进行完整审查。仅梦境循环就值得这个星标。无状态Agent是死路一条，这是缺失的持久层。”

mrsharma：

“Garry这太棒了！！通过3个阶段添加到我的OpenClaw中，砰！”

许多开发者询问了与其他工具的兼容性、性能对比以及实际部署成本等问题，显示出强烈的实际应用兴趣。

技术架构深度解析

知识模型

每个大脑页面都遵循”编译真理 + 时间线”模式：

---
type: concept
title: Do Things That Don't Scale
tags: [startups, growth, pg-essay]
---

Paul Graham认为，创业公司早期应该做不可扩展的事情。
最常见的是手动一个一个招聘用户。Airbnb挨家挨户
在纽约为公寓拍照。Stripe为早期用户手动
安装他们的支付集成。

关键见解：不可扩展的努力教会了你用户真正
想要什么，这是你无法通过其他方式学到的。

---

- 2013-07-01: 发布于paulgraham.com
- 2024-11-15: 在W25启动会议中被引用
- 2025-02-20: 在关于AI Agent入职策略的讨论中被引用

---分隔符上方：编译真理。你当前的最佳理解。当新证据改变图景时会被重写。下方：时间线。只追加的证据轨迹。只被添加，从不编辑。

编译真理是答案。时间线是证明。

搜索机制

只使用关键词搜索会错过概念匹配。”忽略传统智慧”找不到名为”天才巴士票理论”的文章，尽管这完全就是关于那个主题。只使用向量搜索会在嵌入被周围文本稀释时错过精确短语。RRF融合两者都对。多查询扩展捕捉你没想到了的表述。

与OpenClaw/Hermes的集成

GBrain是世界知识——人物、公司、交易、会议、概念、你的原创思考。它是你对世界了解的长期记忆。

OpenClaw agent内存（memory_search）是操作状态——偏好、决策、会话上下文、Agent应该如何表现。

它们是互补的：


层	存储什么	如何查询
gbrain	人物、公司、会议、想法、媒体	`gbrain search` 、`gbrain query`、`gbrain get`
Agent内存	偏好、决策、操作配置	`memory_search`
会话上下文	当前对话	(自动)

所有三层都应该被检查。GBrain用于关于世界的事实。内存用于Agent配置。会话用于直接上下文。

实际部署指南

先决条件

没有Postgres，你现在就可以使用GBrain知识模型：技能、模式和编译真理 + 时间线模式适用于任何读取和写入markdown文件的Agent。当grep不再足够时再添加Postgres。

使用Postgres时，GBrain需要三样东西：


依赖	用途	获取方式
Supabase账户	Postgres + pgvector数据库	supabase.com (专业版, $25/月)
OpenAI API密钥	嵌入（text-embedding-3-large）	platform.openai.com/api-keys
Anthropic API密钥	多查询扩展 + LLM分块（Haiku）	console.anthropic.com

安装步骤

对于OpenClaw或HermesAgent用户（推荐）：

将gbrain (https://github.com/garrytan/gbrain) 设置为我的
知识大脑。

1. 确保bun已安装：
   curl -fsSL https://bun.sh/install | bash
   然后运行：bun add github:garrytan/gbrain

2. 运行：gbrain init --supabase
   （按照向导连接我的Supabase数据库）

3. 扫描 ~/git/ 和 ~/Documents/ 中的markdown仓库，
   选择最好的一个，然后运行：gbrain import <path> --no-embed

4. 对导入的数据运行查询以证明搜索有效

5. 阅读docs/GBRAIN_RECOMMENDED_SCHEMA.md并提议
   重构我的知识库

6. 阅读docs/GBRAIN_SKILLPACK.md并用生产Agent模式
   更新所有你的技能：大脑-智能体循环、
   实体检测、来源归属、铁法则反向链接、
   和增强管道

7. 为`gbrain check-update`设置每日cron。
   只在新功能时通知我，而不是补丁。
   永不自动安装，只告诉我有什么新功能。

8. 设置自动同步，使向量数据库与
   大脑仓库保持最新。阅读GBRAIN_SKILLPACK.md第18节
   了解方法（cron、--watch、webhook）。选择适合
   你环境的。总是链式：
   gbrain sync --repo <path> && gbrain embed --stale
   验证：推送更改，确认它出现在搜索中。

9. 运行验证手册（docs/GBRAIN_VERIFY.md）
   确认一切正常：模式、同步、嵌入、
   大脑优先查找。

快速体验

GBrain不附带演示数据。它发现你的markdown并使其可搜索。

第一幕：发现 GBrain扫描你的机器寻找markdown仓库：

=== GBrain环境发现 ===

  ~/git/brain (2.3GB, 342 .md文件, 87个二进制文件)
    类型：纯markdown（准备好导入）

  ~/Documents/obsidian-vault (180MB, 1,203 .md文件, 0个二进制文件)
    类型：Obsidian仓库（可用wikilink转换）

=== 发现完成 ===

第二幕：导入 你的文件从仓库移动到Supabase。

gbrain import ~/git/brain/
# 导入342个文件到Supabase（1,847个块）。后台嵌入中...

gbrain stats
# 页面：342, 块：1,847, 已嵌入：0（嵌入中...）, 链接：0

第三幕：搜索 Agent从你的实际内容中选择一个查询。

# Agent读取你的语料库并选择相关查询
gbrain query "我们对竞争动态了解多少？"
# 3个结果，通过混合搜索评分（向量 + 关键词 + RRF融合）

# 30秒后，嵌入完成：
gbrain stats
# 页面：342, 块：1,847, 已嵌入：1,847, 链接：0

# 现在语义搜索也上线了
gbrain query "我们现在的最大风险是什么？"
# 通过意义而不是关键词找到关于护城河、董事会准备和战略的页面

你的文件数量会不同。你的查询会不同。Agent根据导入的内容选择它们。这正是重点：这是你的大脑，不是演示。

未来展望

GBrain代表了一个重要的范式转变：从无状态的AI助手到拥有持久记忆和持续学习能力的智能体。

正如社区成员所指出的，我们正在从”更好的提示”转向”更好的记忆”。这可能是AI发展到AGI的关键一步。

Garry Tan的开源举动，为整个AI社区提供了一个成熟的参考实现。这不仅是一个工具，更是一个完整的知识管理系统——从数据模型、搜索算法到Agent技能包的完整解决方案。

对于那些想要在中长期内保持竞争力的AI开发者来说，理解并实施类似的知识管理系统，可能是下一个重要的发展方向。

结语

当大多数人都还在讨论prompt engineering时，Garry Tan已经构建了一个每天都在变聪明的系统。GBrain告诉我们，真正的AI助手需要的不是更聪明的算法，而是更好的记忆。

这种知识的复合增长效应，正是通往更强大AI的关键路径。现在，这个路径向每个人开放。

相关链接：

• GBrain GitHub: https://github.com/garrytan/gbrain

如果你对构建自己的知识大脑感兴趣，或者想了解GBrain在你的项目中的应用，欢迎关注公众号「光影织梦」，给我们留言交流。