01
它是什么
GBrain 是 Garry Tan 为自己的 AI Agent(OpenClaw + Hermes)打造的持久知识大脑。不是一个简单的向量数据库或 RAG 管道——它是一个完整的知识操作系统:
核心理念:Agent 白天工作时摄入信息(会议、邮件、推文、语音),夜间自动合并记忆、修复引用、丰富实体。你醒来时,大脑比你睡前更聪明。
关键特征:
- 自动建图 — 每次写入自动抽取实体关系(attended, works_at, invested_in, founded, advises),零 LLM 调用
- 混合检索 — 向量搜索 + 关键词 + 知识图谱 backlink boosting,三路融合
- Slug-based — 所有内容以 Markdown 页面组织,slug 为唯一标识
- 可插拔引擎 — PGLite(嵌入式,2 秒启动)或 Postgres+pgvector(生产级)
- 34 个 Skills — 从摄入、查询、丰富到发布,全流程覆盖
- 内置 Benchmark — BrainBench + LongMemEval,可量化检索质量
02
关键数据
Benchmark 成绩(240 页 Opus 生成的富文本语料):
| 指标 | GBrain (完整) | GBrain (无图谱) | ripgrep-BM25 + 向量 |
| P@5 (精确率) | 49.1% | 17.7% | ~18% |
| R@5 (召回率) | 97.9% | ~66% | ~65% |
知识图谱层 + v0.12 抽取质量贡献了 +31.4 points P@5 的提升。
03
架构解析
GBrain 采用 Thin Harness, Fat Skills 哲学——核心是一个轻量引擎接口,所有智能逻辑在 Markdown Skills 中实现。
┌─────────────────────────────────────────────────────────┐
│ AI Agent (OpenClaw / Hermes / Claude Code) │
└────────────────────────────┬────────────────────────────┘
│ MCP (stdio / HTTP+OAuth)
▼
┌─────────────────────────────────────────────────────────┐
│ GBrain CLI / Server │
├─────────────────────────────────────────────────────────┤
│ Skills (34) │ Core Engine Interface │
│ ───────────── │ ───────────────────── │
│ • brain-ops │ • Pages CRUD │
│ • query │ • Vector Search │
│ • enrich │ • Keyword Search (tsvector) │
│ • ingest │ • Links (知识图谱) │
│ • meeting-ingest │ • Chunks + Embeddings │
│ • media-ingest │ • Timeline │
│ • cron-scheduler │ • Tags │
│ • maintain │ • Versions │
│ • publish │ • Config │
│ • ... │ • Health / Stats │
├─────────────────────┴───────────────────────────────────┤
│ Hybrid Search (RRF Fusion) │
│ vector + keyword + graph backlinks → ranked results │
├─────────────────────────────────────────────────────────┤
│ Engine: PGLiteEngine (default) │ PostgresEngine │
│ 嵌入式 PG 17.5 via WASM │ Supabase / 自建 │
│ 零配置,2 秒启动 │ 7K+ 页面,多用户 │
└─────────────────────────────────────────────────────────┘
可插拔引擎设计:
| 用户类型 | 推荐引擎 | 理由 |
| 入门 / 个人 | PGLiteEngine | 零配置,无需服务器,2 秒启动 |
| 重度用户 (7K+ 页面) | PostgresEngine + Supabase | 性能、多用户、RLS |
| 开源黑客 | PGLiteEngine | 单文件,git-friendly |
| 团队/企业 | PostgresEngine 自建 | 审计、权限控制 |
gbrain migrate --to supabase/pglite 可在引擎间无缝迁移。
04
34 Skills 体系
GBrain 的 Skills 是 Fat Markdown 文件——不是代码插件,而是给 Agent 的操作手册。分为 5 大类:
🧠 Brain Operations
brain-ops · query · enrich · maintain
核心读写。query 支持语义搜索和图谱查询("谁在 Acme AI 工作?")。enrich 自动丰富人物/公司页面。maintain 夜间合并重复、修复引用。
📥 Content Ingestion
ingest · idea-ingest · media-ingest · meeting-ingestion
多模态摄入。链接/文章/推文 → idea-ingest。YouTube/PDF/播客/书籍 → media-ingest。会议录音 → meeting-ingestion。自动路由。
🔗 Knowledge Graph
citation-fixer · frontmatter-guard · repo-architecture
图谱维护。自动修复断裂引用,验证 frontmatter 格式,确保文件归档到正确目录(people/ companies/ concepts/)。
⚙️ Operations
cron-scheduler · daily-task-manager · briefing · minion-orchestrator
运营自动化。定时任务调度、每日简报、任务管理、子 Agent 编排(spawn/steer/pause)。
🛡️ Quality & Safety
signal-detector · smoke-test · skillpack-check · cross-modal-review
每条消息都经过 signal-detector 扫描。smoke-test 在重启后自动验证。cross-modal-review 提供第二意见。
05
混合检索引擎
GBrain 的检索不是简单的向量搜索。它是三路融合:
Query: "谁在 2026 Q1 投资了 AI 公司?"
│
├─→ Vector Search (语义相似)
│ → 找到相关页面 by embedding 距离
│
├─→ Keyword Search (tsvector/BM25)
│ → 精确匹配 "投资" "2026" "Q1"
│
└─→ Graph Traversal (backlink boosting)
→ 从 "invested_in" 关系出发
→ 找到所有 investor → company 链接
→ 按 backlink 数量加权
│
▼
RRF Fusion (Reciprocal Rank Fusion)
│
▼
Ranked Results (去重 + 排序)
为什么图谱层这么重要?
纯向量搜索回答"谁投资了 X"时,只能靠语义相似度猜。但 GBrain 的图谱层有明确的 invested_in 关系链接,可以精确遍历。这就是 P@5 从 17.7% 跳到 49.1% 的原因。
关键设计:实体关系抽取不用 LLM。每次 page write 时,用规则引擎从 frontmatter + 正文中提取 typed links。零成本、零延迟、确定性结果。
06
MCP 接入方式
GBrain 提供两种 MCP 传输:
| 模式 | 命令 | 适用客户端 | 认证 |
| stdio (本地) | gbrain serve | Claude Code, Cursor, Windsurf | 无需 |
| HTTP + OAuth 2.1 (远程) | gbrain serve --http | ChatGPT, Claude Desktop, Perplexity, 任何 HTTP MCP 客户端 | OAuth 2.1 (PKCE / client credentials) |
HTTP 模式亮点:
- 内置 OAuth 2.1 服务器(client credentials + auth code + PKCE + refresh rotation)
- 内嵌 React Admin Dashboard(/admin)— 实时 SSE 活动流、客户端管理、权限配置
- 30+ scoped operations(read / write / admin)
- ChatGPT 原生支持 — 通过 OAuth 2.1 + PKCE 直接连接,无需桥接
- ngrok / Tailscale / 云主机暴露即可
这解决了你的核心问题:ChatGPT 不支持 MCP?GBrain 的 HTTP 模式自带 OAuth 2.1,ChatGPT 的 MCP connector 原生支持。不需要 Custom GPT Action 桥接。
07
对比分析
GBrain vs 之前调研的方案:
| 维度 | GBrain | doobidoo/mcp-memory-service | Mem0 OSS | Supermemory |
| 定位 | 完整 Agent Brain OS | 通用记忆后端 | 记忆算法库 | 跨客户端记忆 SaaS |
| 知识图谱 | ✅ 自动建图,零 LLM | ✅ 基础图谱 | ✅ 实体链接 | ❌ |
| MCP HTTP | ✅ + OAuth 2.1 | ✅ SSE/HTTP | ❌ 需自包 | ✅ 云端 |
| ChatGPT 接入 | ✅ 原生 OAuth | 需桥接 | 需桥接 | ❌ |
| 自部署 | ✅ PGLite 零配置 | ✅ | ✅ | ❌ 云端 |
| Benchmark | P@5 49.1%, R@5 97.9% | 无公开 | LoCoMo 91.6 | LongMemEval #1 |
| 自动摄入 | ✅ 会议/邮件/推文/语音 | ❌ 手动 | ❌ 手动 | ✅ Connectors |
| 夜间自修复 | ✅ cron 自动合并/修复 | ❌ | ❌ | ❌ |
| Skills 体系 | 34 个 fat-markdown skills | 无 | 无 | 无 |
| Embedding | 14 种 provider | OpenAI | 多种 | 内置 |
| 安装时间 | 30 分钟 | ~1 小时 | 需开发 | 10 分钟 |
| 生态 | OpenClaw / Hermes 原生 | 通用 | Python 生态 | 独立 SaaS |
08
适用判断
∴ GBrain 是目前最完整的 AI Agent Brain 方案
它不只是"记忆存储",而是一个知识操作系统——从摄入、建图、检索、维护到发布的完整闭环。
对你的场景:
- ✅ 你已经在用 OpenClaw — GBrain 就是为 OpenClaw 设计的
- ✅ 需要 ChatGPT 接入 — HTTP + OAuth 2.1 原生支持
- ✅ 需要自部署 — PGLite 零配置,跑在你的 VPS 上
- ✅ 需要跨客户端 — stdio (Claude Code) + HTTP (其他所有)
- ✅ 知识图谱 — 比纯向量搜索强 31+ points
- ⚠️ 资源 — 你的机器 4 核 8GB,PGLite 模式够用但大规模可能吃紧
vs 之前推荐的 doobidoo:
GBrain 在几乎所有维度上都更强。唯一 doobidoo 胜出的点是"更轻量/更通用"——如果你只需要一个简单的记忆 API,doobidoo 够了。但如果你要一个会自己变聪明的大脑,GBrain 是正确答案。
安装:让 Agent 读取 https://raw.githubusercontent.com/garrytan/gbrain/master/INSTALL_FOR_AGENTS.md 即可开始。