跳到主要內容

Zvec:阿里巴巴開源的嵌入式向量資料庫,跑在你的應用裡

alibaba/zvec on GitHub

大部分向量資料庫都是獨立服務——Pinecone、Weaviate、Milvus,你要架伺服器、管連線、擔心延遲。但如果你的應用只是個 notebook、CLI 工具、或邊緣裝置,這些都是過度設計。Zvec 走另一條路:把向量搜尋直接塞進你的 process 裡跑


In-process 向量資料庫的優勢

Loading diagram...

沒有網路跳躍,沒有序列化開銷,沒有服務要維護。Zvec 宣稱可以在毫秒內搜尋數十億向量,這在 in-process 場景裡是相當激進的數字。


核心功能

功能說明
Dense + Sparse 雙向量同一個索引支援兩種 embedding,適合混合檢索
Multi-vector 查詢一次查詢多個向量,做複合語意檢索
Hybrid 搜尋語意相似 + 結構化過濾(metadata)
跨平台Linux x86/ARM、macOS ARM、Windows x86
多語言綁定C++ 核心 + Python/Node.js

v0.3.0(2026 年 4 月)加入 RabitQ 量化、C-API 和 MCP 整合,讓 Zvec 可以直接被 AI agent 當作記憶後端使用。


適合的使用場景

  • RAG 應用:本地 RAG 不想維護向量 DB 服務
  • Agent memory:Claude Code、Cursor 這類 IDE 內的記憶體儲存
  • 嵌入式 AI:邊緣裝置、離線應用
  • Jupyter 研究:notebook 裡直接跑向量搜尋實驗

如果你的場景是「單一進程 + 本地索引」,Zvec 比架一台 Milvus 簡單太多。


結語

Zvec 的定位很清楚:不是要取代 Pinecone,而是服務那些用不到 Pinecone 的場景。9.3k stars 說明社群認可這個方向。如果你在寫 local-first RAG 或 agent,值得評估把它接進去。