跳到主要內容

OpenSpace:自我進化的 AI Agent 框架,省 46% token、收益高 4.2 倍

HKUDS/OpenSpace on GitHub

AI agent 的三個老問題:每次處理類似任務都從頭推理、失敗經驗不會累積、工具更新後技能就壞掉。OpenSpace 的設計正面解決這三件事——讓 agent 的技能可以自動修復、自動改進、自動學習,並且在 agent 網絡之間共享。

結果很實際:46% 更少的 token 消耗、4.2 倍的專業任務收益、165 個技能在 benchmark 過程中自主演化出來。


三個自我進化模式

Loading diagram...

FIX 解決的是技能腐壞問題:你寫的 skill 依賴某個 API,API 改了之後 skill 就壞了。OpenSpace 會偵測失敗、分析錯誤、自動修改 skill code,不需要人類介入。

DERIVED 是優化路徑:當某個 skill 在實際執行中表現良好,系統會嘗試產生變體版本,測試是否能更快、更準、更省 token,然後把改進版加入 registry。

CAPTURED 是最有趣的——當 agent 解決一個沒有現成 skill 的任務時,系統會把那次的成功路徑「抓取」下來,自動封裝成新 skill,未來類似任務就可以直接呼叫。


集體智慧:open-space.cloud

單一 agent 的進化速度有上限,OpenSpace 的第二個核心設計是讓多個 agent 共享技能池:

# 上傳技能到雲端
openspace skill publish my-skill --visibility public

# 下載別人的技能
openspace skill install user/skill-name

# 在自己的 registry 搜尋
openspace skill search "pdf extraction"

open-space.cloud 是一個社群 registry,skill 可以選擇公開、私有、或團隊共享。這讓 OpenSpace 不只是框架,更像是一個 agent 技能的「npm / pip 生態」。


效能數字

OpenSpace vs Baseline(baseline = 100)

測試場景是 GDPVal——一個涵蓋 6 個產業、50 個真實商業任務的 benchmark。結果:

  • 46% 更少的 token:同樣的任務,OpenSpace 用一半的 token 完成
  • 4.2 倍專業任務收益:把任務結果折算成美元,OpenSpace 產生的「價值」是 baseline 的 4.2 倍
  • 72.8% 價值捕獲率:在專業任務套件上達到的整體效率

這些數字的含金量在於——不是在合成 benchmark 上跑的,而是真實商業任務。


技術架構

Loading diagram...

Skill Engine 是核心——負責技能的註冊、分析、演化。Grounding Layer 是執行層,把 shell 指令、Computer Use、MCP 工具、網頁搜尋統一成一致的後端。Cloud Client 連接到 open-space.cloud,做技能的搜尋、上傳、下載。

持久層用 SQLite 加上版本 DAG,每個技能的演化歷史都可追溯——這讓 debug 和 rollback 都變得簡單。


支援的 Agent 生態

OpenSpace 不是要取代現有 agent 框架,而是作為 MCP server 接進去:

Agent整合方式
Claude CodeMCP 配置 + delegate-task skill
CodexMCP 配置
CursorMCP 配置
OpenClaw原生支援
nanobotMCP 配置

你原本用什麼 agent,都可以把 OpenSpace 接上去當作「技能進化層」。這種設計讓遷移成本極低。


安裝與第一次使用

# 安裝
git clone https://github.com/HKUDS/OpenSpace.git
cd OpenSpace
pip install -e .

# 驗證
openspace-mcp --help

# CLI 模式(不接 agent 也能跑)
openspace --query "幫我把這個資料夾裡的 PDF 全部擷取成 markdown"

# 開啟本地 dashboard 看技能演化
openspace-dashboard

Dashboard 用 React + Tailwind 寫的,可以視覺化看到每個 skill 的版本樹、執行統計、成功率變化。


實戰案例:20 面板監控儀表板

OpenSpace 團隊自己 dogfood 的一個案例:用 OpenSpace agent 從零建一個 20 面板的監控 dashboard。

結果:60+ 個技能自主演化零人工程式碼,最終產出一個可運行的 React dashboard。整個過程記錄在 dashboard 的 skill lineage 裡,你可以看到每個技能怎麼被 FIX、DERIVED、CAPTURED 的。


使用場景

  • 自動化軟體開發:多檔案協調、技能累積,適合長期專案
  • 專業文件生成:帶品質保證的批量文件處理
  • 合規與表單自動化:表單處理類任務受益於技能重用
  • 媒體製作工作流:影片、圖像、文字的批次處理
  • GTM / 營運任務:重複性高的業務流程

和其他 agent 框架的差異

框架核心賣點OpenSpace 差異
LangChain工具鏈抽象沒有自我進化機制
AutoGen多 agent 對話沒有跨 agent 技能共享
CrewAI角色分工沒有自動修復技能
OpenSpace自我進化 + 集體智慧技能層級的生態系

重點不是「我能用哪些工具」,而是「我的 agent 能不能從每次執行中變得更強」。OpenSpace 押注的是後者。


結語

OpenSpace 把 AI agent 的問題從「怎麼把 LLM 接到工具」重新定義成「怎麼讓 agent 的技能自主演化」。技能腐壞的自動修復、成功模式的自動提取、跨 agent 的技能共享——這三個設計加起來,把 agent 從「有狀態的一次性執行者」變成「會累積經驗的長期工作者」。

5.2k stars、165 個自主演化的技能、46% token 節省——這些數字說明這不是概念驗證,是可以直接用的工具。如果你在建 agent 系統,OpenSpace 值得當作技能層接進去。