OpenSpace:自我進化的 AI Agent 框架,省 46% token、收益高 4.2 倍
AI agent 的三個老問題:每次處理類似任務都從頭推理、失敗經驗不會累積、工具更新後技能就壞掉。OpenSpace 的設計正面解決這三件事——讓 agent 的技能可以自動修復、自動改進、自動學習,並且在 agent 網絡之間共享。
結果很實際:46% 更少的 token 消耗、4.2 倍的專業任務收益、165 個技能在 benchmark 過程中自主演化出來。
三個自我進化模式
FIX 解決的是技能腐壞問題:你寫的 skill 依賴某個 API,API 改了之後 skill 就壞了。OpenSpace 會偵測失敗、分析錯誤、自動修改 skill code,不需要人類介入。
DERIVED 是優化路徑:當某個 skill 在實際執行中表現良好,系統會嘗試產生變體版本,測試是否能更快、更準、更省 token,然後把改進版加入 registry。
CAPTURED 是最有趣的——當 agent 解決一個沒有現成 skill 的任務時,系統會把那次的成功路徑「抓取」下來,自動封裝成新 skill,未來類似任務就可以直接呼叫。
集體智慧:open-space.cloud
單一 agent 的進化速度有上限,OpenSpace 的第二個核心設計是讓多個 agent 共享技能池:
# 上傳技能到雲端
openspace skill publish my-skill --visibility public
# 下載別人的技能
openspace skill install user/skill-name
# 在自己的 registry 搜尋
openspace skill search "pdf extraction"
open-space.cloud 是一個社群 registry,skill 可以選擇公開、私有、或團隊共享。這讓 OpenSpace 不只是框架,更像是一個 agent 技能的「npm / pip 生態」。
效能數字
OpenSpace vs Baseline(baseline = 100)
測試場景是 GDPVal——一個涵蓋 6 個產業、50 個真實商業任務的 benchmark。結果:
- 46% 更少的 token:同樣的任務,OpenSpace 用一半的 token 完成
- 4.2 倍專業任務收益:把任務結果折算成美元,OpenSpace 產生的「價值」是 baseline 的 4.2 倍
- 72.8% 價值捕獲率:在專業任務套件上達到的整體效率
這些數字的含金量在於——不是在合成 benchmark 上跑的,而是真實商業任務。
技術架構
Skill Engine 是核心——負責技能的註冊、分析、演化。Grounding Layer 是執行層,把 shell 指令、Computer Use、MCP 工具、網頁搜尋統一成一致的後端。Cloud Client 連接到 open-space.cloud,做技能的搜尋、上傳、下載。
持久層用 SQLite 加上版本 DAG,每個技能的演化歷史都可追溯——這讓 debug 和 rollback 都變得簡單。
支援的 Agent 生態
OpenSpace 不是要取代現有 agent 框架,而是作為 MCP server 接進去:
| Agent | 整合方式 |
|---|---|
| Claude Code | MCP 配置 + delegate-task skill |
| Codex | MCP 配置 |
| Cursor | MCP 配置 |
| OpenClaw | 原生支援 |
| nanobot | MCP 配置 |
你原本用什麼 agent,都可以把 OpenSpace 接上去當作「技能進化層」。這種設計讓遷移成本極低。
安裝與第一次使用
# 安裝
git clone https://github.com/HKUDS/OpenSpace.git
cd OpenSpace
pip install -e .
# 驗證
openspace-mcp --help
# CLI 模式(不接 agent 也能跑)
openspace --query "幫我把這個資料夾裡的 PDF 全部擷取成 markdown"
# 開啟本地 dashboard 看技能演化
openspace-dashboard
Dashboard 用 React + Tailwind 寫的,可以視覺化看到每個 skill 的版本樹、執行統計、成功率變化。
實戰案例:20 面板監控儀表板
OpenSpace 團隊自己 dogfood 的一個案例:用 OpenSpace agent 從零建一個 20 面板的監控 dashboard。
結果:60+ 個技能自主演化,零人工程式碼,最終產出一個可運行的 React dashboard。整個過程記錄在 dashboard 的 skill lineage 裡,你可以看到每個技能怎麼被 FIX、DERIVED、CAPTURED 的。
使用場景
- 自動化軟體開發:多檔案協調、技能累積,適合長期專案
- 專業文件生成:帶品質保證的批量文件處理
- 合規與表單自動化:表單處理類任務受益於技能重用
- 媒體製作工作流:影片、圖像、文字的批次處理
- GTM / 營運任務:重複性高的業務流程
和其他 agent 框架的差異
| 框架 | 核心賣點 | OpenSpace 差異 |
|---|---|---|
| LangChain | 工具鏈抽象 | 沒有自我進化機制 |
| AutoGen | 多 agent 對話 | 沒有跨 agent 技能共享 |
| CrewAI | 角色分工 | 沒有自動修復技能 |
| OpenSpace | 自我進化 + 集體智慧 | 技能層級的生態系 |
重點不是「我能用哪些工具」,而是「我的 agent 能不能從每次執行中變得更強」。OpenSpace 押注的是後者。
結語
OpenSpace 把 AI agent 的問題從「怎麼把 LLM 接到工具」重新定義成「怎麼讓 agent 的技能自主演化」。技能腐壞的自動修復、成功模式的自動提取、跨 agent 的技能共享——這三個設計加起來,把 agent 從「有狀態的一次性執行者」變成「會累積經驗的長期工作者」。
5.2k stars、165 個自主演化的技能、46% token 節省——這些數字說明這不是概念驗證,是可以直接用的工具。如果你在建 agent 系統,OpenSpace 值得當作技能層接進去。