跳到主要內容

GBrain:YC 總裁 Garry Tan 開源的 Agent 記憶系統,解決 10,000 個 Markdown 文件的全量召回問題

Agent 的記憶問題被低估了。大多數人把 context window 塞滿就叫做「記憶」,但那不是記憶,那是貼上去的文字堆。Garry Tan 在 2026 年 4 月 10 日公開了他自己跑 OpenClaw 和 Hermes Agent 的那套記憶系統——GBrain,MIT 授權,直接可以 fork。

這個系統在生產環境下管理 17,888 頁文件、4,383 個人脈節點、723 家公司,跑著 21 個自主 cron 任務。這不是玩具,是在用的東西。


架構核心:Compiled Truth + Timeline

GBrain 用兩條獨立的資料軌道解決同一個問題:

Compiled Truth — 這是你對某個主題「當下最佳理解」的快照。每次有新資訊進來,系統會把既有理解重新編譯,更新成最新狀態。類似資料庫的 materialized view,但針對的是知識,不是查詢結果。

Timeline — append-only 的原始事件記錄。每一條新資訊都只追加、不覆蓋,保留完整的更新歷程。

Loading diagram...

這個雙軌設計解決了一個真實矛盾:你既需要「快速拿到當下最準確的答案」(Compiled Truth),也需要「知道這個答案是怎麼演變來的」(Timeline)。單靠向量資料庫沒辦法同時做好這兩件事。


能存不等於能找到。GBrain 的召回層用三種方式同時搜尋,再用 RRF(Reciprocal Rank Fusion)把結果融合排序:

召回方式相對精準度比較(模擬值)

  • 向量搜尋:語意相似度,能跨語言、跨措辭找到概念上相關的內容
  • 關鍵字搜尋:精確匹配,對人名、公司名、專有名詞特別有效
  • RRF 融合:把兩種排名列表合併,讓在兩種方法中都排名靠前的結果得到更高分

RRF 的關鍵洞見是:一個同時在語意搜尋和關鍵字搜尋中都出現的結果,比只在其中一種方法中排第一的結果更值得信任。這個假設在大多數知識型查詢中成立。


安裝與啟動

預設後端是 PGLite——embedded 資料庫,不需要任何伺服器,本機直接跑:

git clone https://github.com/garrytan/gbrain.git
cd gbrain
bun install
gbrain init

需要擴展到多人共用或雲端同步時,可以切換到 Supabase 後端——遷移路徑已經內建,不需要重寫業務邏輯。


實際應用場景

會議準備:在開會前幾分鐘自動拉出與會者的所有相關背景——過去的互動、公司資訊、上次談到哪、有哪些未決問題。Garry Tan 的 4,383 個人脈節點就是這樣用的。

個人知識庫問答:把你自己的 Markdown 筆記全部灌進去,超過一萬個文件也沒問題。不需要記得在哪個文件裡寫過什麼,直接問 agent。

自主資料豐富化:21 個 cron 任務在後台持續跑,自動從各種來源拉資料進來更新記憶——這是讓記憶系統保持「活的」的機制,而不是靜態快照。

語音整合:GBrain 設計了語音介面整合點,讓記憶系統可以接入語音助理流程。


這個系統解決的真實問題

大多數 agent 的記憶方案是「每次都全塞進 context」或「用 RAG 但精準度不夠」。GBrain 的定位更接近一個真正的長期記憶系統:

  • 資料規模可以超過任何 context window 的上限
  • 召回精準度透過 hybrid search 比單純 RAG 更高
  • 歷史記錄永遠保留,不因為「編譯更新」而遺失

如果你正在用 OpenClaw 或類似的自主 agent 框架,這個記憶層值得認真評估。Garry Tan 把自己在用的東西直接開源了,這種情況在 YC 體系裡不常見。