GBrain：YC 總裁 Garry Tan 開源的 Agent 記憶系統，解決 10,000 個 Markdown 文件的全量召回問題

If you want your OpenClaw or Hermes Agent to be able to have perfect total recall of all 10,000+ markdown files, GBrain is here to help. It's exactly my OpenClaw/Hermes Agent setup. MIT-licensed open source. Hope it helps you build your mini-AGI. github.com/garrytan/gbrain

7:00 AM · Apr 10, 2026

5.9K

Read 224 replies

Agent 的記憶問題被低估了。大多數人把 context window 塞滿就叫做「記憶」，但那不是記憶，那是貼上去的文字堆。Garry Tan 在 2026 年 4 月 10 日公開了他自己跑 OpenClaw 和 Hermes Agent 的那套記憶系統——GBrain，MIT 授權，直接可以 fork。

這個系統在生產環境下管理 17,888 頁文件、4,383 個人脈節點、723 家公司，跑著 21 個自主 cron 任務。這不是玩具，是在用的東西。

架構核心：Compiled Truth + Timeline

GBrain 用兩條獨立的資料軌道解決同一個問題：

Compiled Truth — 這是你對某個主題「當下最佳理解」的快照。每次有新資訊進來，系統會把既有理解重新編譯，更新成最新狀態。類似資料庫的 materialized view，但針對的是知識，不是查詢結果。

Timeline — append-only 的原始事件記錄。每一條新資訊都只追加、不覆蓋，保留完整的更新歷程。

Loading diagram...

這個雙軌設計解決了一個真實矛盾：你既需要「快速拿到當下最準確的答案」（Compiled Truth），也需要「知道這個答案是怎麼演變來的」（Timeline）。單靠向量資料庫沒辦法同時做好這兩件事。

記憶召回：三層 Hybrid Search

能存不等於能找到。GBrain 的召回層用三種方式同時搜尋，再用 RRF（Reciprocal Rank Fusion）把結果融合排序：

召回方式相對精準度比較（模擬值）

向量搜尋：語意相似度，能跨語言、跨措辭找到概念上相關的內容
關鍵字搜尋：精確匹配，對人名、公司名、專有名詞特別有效
RRF 融合：把兩種排名列表合併，讓在兩種方法中都排名靠前的結果得到更高分

RRF 的關鍵洞見是：一個同時在語意搜尋和關鍵字搜尋中都出現的結果，比只在其中一種方法中排第一的結果更值得信任。這個假設在大多數知識型查詢中成立。

安裝與啟動

預設後端是 PGLite——embedded 資料庫，不需要任何伺服器，本機直接跑：

git clone https://github.com/garrytan/gbrain.git
cd gbrain
bun install
gbrain init

需要擴展到多人共用或雲端同步時，可以切換到 Supabase 後端——遷移路徑已經內建，不需要重寫業務邏輯。

實際應用場景

會議準備：在開會前幾分鐘自動拉出與會者的所有相關背景——過去的互動、公司資訊、上次談到哪、有哪些未決問題。Garry Tan 的 4,383 個人脈節點就是這樣用的。

個人知識庫問答：把你自己的 Markdown 筆記全部灌進去，超過一萬個文件也沒問題。不需要記得在哪個文件裡寫過什麼，直接問 agent。

自主資料豐富化：21 個 cron 任務在後台持續跑，自動從各種來源拉資料進來更新記憶——這是讓記憶系統保持「活的」的機制，而不是靜態快照。

語音整合：GBrain 設計了語音介面整合點，讓記憶系統可以接入語音助理流程。

這個系統解決的真實問題

大多數 agent 的記憶方案是「每次都全塞進 context」或「用 RAG 但精準度不夠」。GBrain 的定位更接近一個真正的長期記憶系統：

資料規模可以超過任何 context window 的上限
召回精準度透過 hybrid search 比單純 RAG 更高
歷史記錄永遠保留，不因為「編譯更新」而遺失

如果你正在用 OpenClaw 或類似的自主 agent 框架，這個記憶層值得認真評估。Garry Tan 把自己在用的東西直接開源了，這種情況在 YC 體系裡不常見。