OpenSpace：自我進化的 AI Agent 框架，省 46% token、收益高 4.2 倍

AI agent 的三個老問題：每次處理類似任務都從頭推理、失敗經驗不會累積、工具更新後技能就壞掉。OpenSpace 的設計正面解決這三件事——讓 agent 的技能可以自動修復、自動改進、自動學習，並且在 agent 網絡之間共享。

結果很實際：46% 更少的 token 消耗、4.2 倍的專業任務收益、165 個技能在 benchmark 過程中自主演化出來。

三個自我進化模式

Loading diagram...

FIX 解決的是技能腐壞問題：你寫的 skill 依賴某個 API，API 改了之後 skill 就壞了。OpenSpace 會偵測失敗、分析錯誤、自動修改 skill code，不需要人類介入。

DERIVED 是優化路徑：當某個 skill 在實際執行中表現良好，系統會嘗試產生變體版本，測試是否能更快、更準、更省 token，然後把改進版加入 registry。

CAPTURED 是最有趣的——當 agent 解決一個沒有現成 skill 的任務時，系統會把那次的成功路徑「抓取」下來，自動封裝成新 skill，未來類似任務就可以直接呼叫。

集體智慧：open-space.cloud

單一 agent 的進化速度有上限，OpenSpace 的第二個核心設計是讓多個 agent 共享技能池：

# 上傳技能到雲端
openspace skill publish my-skill --visibility public

# 下載別人的技能
openspace skill install user/skill-name

# 在自己的 registry 搜尋
openspace skill search "pdf extraction"

open-space.cloud 是一個社群 registry，skill 可以選擇公開、私有、或團隊共享。這讓 OpenSpace 不只是框架，更像是一個 agent 技能的「npm / pip 生態」。

效能數字

OpenSpace vs Baseline（baseline = 100）

測試場景是 GDPVal——一個涵蓋 6 個產業、50 個真實商業任務的 benchmark。結果：

46% 更少的 token：同樣的任務，OpenSpace 用一半的 token 完成
4.2 倍專業任務收益：把任務結果折算成美元，OpenSpace 產生的「價值」是 baseline 的 4.2 倍
72.8% 價值捕獲率：在專業任務套件上達到的整體效率

這些數字的含金量在於——不是在合成 benchmark 上跑的，而是真實商業任務。

技術架構

Loading diagram...

Skill Engine 是核心——負責技能的註冊、分析、演化。Grounding Layer 是執行層，把 shell 指令、Computer Use、MCP 工具、網頁搜尋統一成一致的後端。Cloud Client 連接到 open-space.cloud，做技能的搜尋、上傳、下載。

持久層用 SQLite 加上版本 DAG，每個技能的演化歷史都可追溯——這讓 debug 和 rollback 都變得簡單。

支援的 Agent 生態

OpenSpace 不是要取代現有 agent 框架，而是作為 MCP server 接進去：

Agent	整合方式
Claude Code	MCP 配置 + delegate-task skill
Codex	MCP 配置
Cursor	MCP 配置
OpenClaw	原生支援
nanobot	MCP 配置

你原本用什麼 agent，都可以把 OpenSpace 接上去當作「技能進化層」。這種設計讓遷移成本極低。

安裝與第一次使用

# 安裝
git clone https://github.com/HKUDS/OpenSpace.git
cd OpenSpace
pip install -e .

# 驗證
openspace-mcp --help

# CLI 模式（不接 agent 也能跑）
openspace --query "幫我把這個資料夾裡的 PDF 全部擷取成 markdown"

# 開啟本地 dashboard 看技能演化
openspace-dashboard

Dashboard 用 React + Tailwind 寫的，可以視覺化看到每個 skill 的版本樹、執行統計、成功率變化。

實戰案例：20 面板監控儀表板

OpenSpace 團隊自己 dogfood 的一個案例：用 OpenSpace agent 從零建一個 20 面板的監控 dashboard。

結果：60+ 個技能自主演化，零人工程式碼，最終產出一個可運行的 React dashboard。整個過程記錄在 dashboard 的 skill lineage 裡，你可以看到每個技能怎麼被 FIX、DERIVED、CAPTURED 的。

使用場景

自動化軟體開發：多檔案協調、技能累積，適合長期專案
專業文件生成：帶品質保證的批量文件處理
合規與表單自動化：表單處理類任務受益於技能重用
媒體製作工作流：影片、圖像、文字的批次處理
GTM / 營運任務：重複性高的業務流程

和其他 agent 框架的差異

框架	核心賣點	OpenSpace 差異
LangChain	工具鏈抽象	沒有自我進化機制
AutoGen	多 agent 對話	沒有跨 agent 技能共享
CrewAI	角色分工	沒有自動修復技能
OpenSpace	自我進化 + 集體智慧	技能層級的生態系

重點不是「我能用哪些工具」，而是「我的 agent 能不能從每次執行中變得更強」。OpenSpace 押注的是後者。

結語

OpenSpace 把 AI agent 的問題從「怎麼把 LLM 接到工具」重新定義成「怎麼讓 agent 的技能自主演化」。技能腐壞的自動修復、成功模式的自動提取、跨 agent 的技能共享——這三個設計加起來，把 agent 從「有狀態的一次性執行者」變成「會累積經驗的長期工作者」。

5.2k stars、165 個自主演化的技能、46% token 節省——這些數字說明這不是概念驗證，是可以直接用的工具。如果你在建 agent 系統，OpenSpace 值得當作技能層接進去。