GBrain 深度解读 — AI Agent 的持久大脑

它是什么

GBrain 是 Garry Tan 为自己的 AI Agent（OpenClaw + Hermes）打造的持久知识大脑。不是一个简单的向量数据库或 RAG 管道——它是一个完整的知识操作系统：

    核心理念：Agent 白天工作时摄入信息（会议、邮件、推文、语音），夜间自动合并记忆、修复引用、丰富实体。你醒来时，大脑比你睡前更聪明。
  

关键特征：

自动建图 — 每次写入自动抽取实体关系（attended, works_at, invested_in, founded, advises），零 LLM 调用
混合检索 — 向量搜索 + 关键词 + 知识图谱 backlink boosting，三路融合
Slug-based — 所有内容以 Markdown 页面组织，slug 为唯一标识
可插拔引擎 — PGLite（嵌入式，2 秒启动）或 Postgres+pgvector（生产级）
34 个 Skills — 从摄入、查询、丰富到发布，全流程覆盖
内置 Benchmark — BrainBench + LongMemEval，可量化检索质量

关键数据

17,888

Pages

4,383

People

723

Companies

Skills

Cron Jobs

Embedding Providers

12 天

构建周期

30 分钟

安装时间

Benchmark 成绩（240 页 Opus 生成的富文本语料）：

指标	GBrain (完整)	GBrain (无图谱)	ripgrep-BM25 + 向量
P@5 (精确率)	49.1%	17.7%	~18%
R@5 (召回率)	97.9%	~66%	~65%

知识图谱层 + v0.12 抽取质量贡献了 +31.4 points P@5 的提升。

架构解析

GBrain 采用 Thin Harness, Fat Skills 哲学——核心是一个轻量引擎接口，所有智能逻辑在 Markdown Skills 中实现。

┌─────────────────────────────────────────────────────────┐ │ AI Agent (OpenClaw / Hermes / Claude Code) │ └────────────────────────────┬────────────────────────────┘ │ MCP (stdio / HTTP+OAuth) ▼ ┌─────────────────────────────────────────────────────────┐ │ GBrain CLI / Server │ ├─────────────────────────────────────────────────────────┤ │ Skills (34) │ Core Engine Interface │ │ ───────────── │ ───────────────────── │ │ • brain-ops │ • Pages CRUD │ │ • query │ • Vector Search │ │ • enrich │ • Keyword Search (tsvector) │ │ • ingest │ • Links (知识图谱) │ │ • meeting-ingest │ • Chunks + Embeddings │ │ • media-ingest │ • Timeline │ │ • cron-scheduler │ • Tags │ │ • maintain │ • Versions │ │ • publish │ • Config │ │ • ... │ • Health / Stats │ ├─────────────────────┴───────────────────────────────────┤ │ Hybrid Search (RRF Fusion) │ │ vector + keyword + graph backlinks → ranked results │ ├─────────────────────────────────────────────────────────┤ │ Engine: PGLiteEngine (default) │ PostgresEngine │ │ 嵌入式 PG 17.5 via WASM │ Supabase / 自建 │ │ 零配置，2 秒启动 │ 7K+ 页面，多用户 │ └─────────────────────────────────────────────────────────┘

可插拔引擎设计：

用户类型	推荐引擎	理由
入门 / 个人	PGLiteEngine	零配置，无需服务器，2 秒启动
重度用户 (7K+ 页面)	PostgresEngine + Supabase	性能、多用户、RLS
开源黑客	PGLiteEngine	单文件，git-friendly
团队/企业	PostgresEngine 自建	审计、权限控制

gbrain migrate --to supabase/pglite 可在引擎间无缝迁移。

34 Skills 体系

GBrain 的 Skills 是 Fat Markdown 文件——不是代码插件，而是给 Agent 的操作手册。分为 5 大类：

🧠 Brain Operations

brain-ops · query · enrich · maintain

核心读写。query 支持语义搜索和图谱查询（"谁在 Acme AI 工作？"）。enrich 自动丰富人物/公司页面。maintain 夜间合并重复、修复引用。

📥 Content Ingestion

ingest · idea-ingest · media-ingest · meeting-ingestion

多模态摄入。链接/文章/推文 → idea-ingest。YouTube/PDF/播客/书籍 → media-ingest。会议录音 → meeting-ingestion。自动路由。

🔗 Knowledge Graph

citation-fixer · frontmatter-guard · repo-architecture

图谱维护。自动修复断裂引用，验证 frontmatter 格式，确保文件归档到正确目录（people/ companies/ concepts/）。

⚙️ Operations

cron-scheduler · daily-task-manager · briefing · minion-orchestrator

运营自动化。定时任务调度、每日简报、任务管理、子 Agent 编排（spawn/steer/pause）。

🛡️ Quality & Safety

signal-detector · smoke-test · skillpack-check · cross-modal-review

每条消息都经过 signal-detector 扫描。smoke-test 在重启后自动验证。cross-modal-review 提供第二意见。

混合检索引擎

GBrain 的检索不是简单的向量搜索。它是三路融合：

Query: "谁在 2026 Q1 投资了 AI 公司？" │ ├─→ Vector Search (语义相似) │ → 找到相关页面 by embedding 距离 │ ├─→ Keyword Search (tsvector/BM25) │ → 精确匹配 "投资" "2026" "Q1" │ └─→ Graph Traversal (backlink boosting) → 从 "invested_in" 关系出发 → 找到所有 investor → company 链接 → 按 backlink 数量加权 │ ▼ RRF Fusion (Reciprocal Rank Fusion) │ ▼ Ranked Results (去重 + 排序)

为什么图谱层这么重要？

纯向量搜索回答"谁投资了 X"时，只能靠语义相似度猜。但 GBrain 的图谱层有明确的 invested_in 关系链接，可以精确遍历。这就是 P@5 从 17.7% 跳到 49.1% 的原因。

    关键设计：实体关系抽取不用 LLM。每次 page write 时，用规则引擎从 frontmatter + 正文中提取 typed links。零成本、零延迟、确定性结果。
  

MCP 接入方式

GBrain 提供两种 MCP 传输：

模式	命令	适用客户端	认证
stdio (本地)	`gbrain serve`	Claude Code, Cursor, Windsurf	无需
HTTP + OAuth 2.1 (远程)	`gbrain serve --http`	ChatGPT, Claude Desktop, Perplexity, 任何 HTTP MCP 客户端	OAuth 2.1 (PKCE / client credentials)

HTTP 模式亮点：

内置 OAuth 2.1 服务器（client credentials + auth code + PKCE + refresh rotation）
内嵌 React Admin Dashboard（/admin）— 实时 SSE 活动流、客户端管理、权限配置
30+ scoped operations（read / write / admin）
ChatGPT 原生支持 — 通过 OAuth 2.1 + PKCE 直接连接，无需桥接
ngrok / Tailscale / 云主机暴露即可

    这解决了你的核心问题：ChatGPT 不支持 MCP？GBrain 的 HTTP 模式自带 OAuth 2.1，ChatGPT 的 MCP connector 原生支持。不需要 Custom GPT Action 桥接。
  

对比分析

GBrain vs 之前调研的方案：

维度	GBrain	doobidoo/mcp-memory-service	Mem0 OSS	Supermemory
定位	完整 Agent Brain OS	通用记忆后端	记忆算法库	跨客户端记忆 SaaS
知识图谱	✅ 自动建图，零 LLM	✅ 基础图谱	✅ 实体链接	❌
MCP HTTP	✅ + OAuth 2.1	✅ SSE/HTTP	❌ 需自包	✅ 云端
ChatGPT 接入	✅ 原生 OAuth	需桥接	需桥接	❌
自部署	✅ PGLite 零配置	✅	✅	❌ 云端
Benchmark	P@5 49.1%, R@5 97.9%	无公开	LoCoMo 91.6	LongMemEval #1
自动摄入	✅ 会议/邮件/推文/语音	❌ 手动	❌ 手动	✅ Connectors
夜间自修复	✅ cron 自动合并/修复	❌	❌	❌
Skills 体系	34 个 fat-markdown skills	无	无	无
Embedding	14 种 provider	OpenAI	多种	内置
安装时间	30 分钟	~1 小时	需开发	10 分钟
生态	OpenClaw / Hermes 原生	通用	Python 生态	独立 SaaS

适用判断

∴ GBrain 是目前最完整的 AI Agent Brain 方案

它不只是"记忆存储"，而是一个知识操作系统——从摄入、建图、检索、维护到发布的完整闭环。

对你的场景：

✅ 你已经在用 OpenClaw — GBrain 就是为 OpenClaw 设计的
✅ 需要 ChatGPT 接入 — HTTP + OAuth 2.1 原生支持
✅ 需要自部署 — PGLite 零配置，跑在你的 VPS 上
✅ 需要跨客户端 — stdio (Claude Code) + HTTP (其他所有)
✅ 知识图谱 — 比纯向量搜索强 31+ points
⚠️ 资源 — 你的机器 4 核 8GB，PGLite 模式够用但大规模可能吃紧

vs 之前推荐的 doobidoo：

GBrain 在几乎所有维度上都更强。唯一 doobidoo 胜出的点是"更轻量/更通用"——如果你只需要一个简单的记忆 API，doobidoo 够了。但如果你要一个会自己变聪明的大脑，GBrain 是正确答案。

安装：让 Agent 读取 https://raw.githubusercontent.com/garrytan/gbrain/master/INSTALL_FOR_AGENTS.md 即可开始。