2026 年初,一個模型在 Hugging Face 上創下最快下載紀錄,發布 24 小時內就引爆開發者社群。
它不是 OpenAI、不是 Anthropic、也不是 Google。
它叫 Kimi K2.5,來自中國新創 Moonshot AI。
為什麼開發者都在討論它
Kimi K2.5 的核心吸引力很簡單:頂級效能 + 開源 + 極低價格。
| 指標 | Kimi K2.5 | Claude Opus 4.5 |
|---|---|---|
| SWE-Bench Verified | 76.8% | 75.2% |
| 輸入 token 價格 | $0.60/M | $15/M |
| 輸出 token 價格 | $2.50/M | $75/M |
| 參數量 | 1T MoE (32B active) | 不公開 |
| 開源 | ✅ | ❌ |
價格差距不是 10%、不是 50%,是整整 25 倍。
技術架構:為什麼 1T 參數不等於 1T 成本
Kimi K2.5 採用 MoE(Mixture of Experts)架構:模型雖有 1 兆個參數,但每次推理只啟動約 320 億個參數。
這就像一個有 1000 名專家的顧問公司,但每次只派最相關的 32 個人來服務你。
好處:
- 推理成本大幅降低(只算 active 參數)
- 不同任務調用不同「專家」,效果更專精
- 擴展性強,未來繼續加專家不影響推理速度
實際能力測試
Agentic 任務(最值得關注)
在 agentic tool-calling 基準測試中,K2.5 的提升幅度是所有競爭者最大的:
- K2.5:+20.1 分提升
- GPT-5.2:+11.0 分
- Claude Opus 4.5:+12.4 分
- Gemini 3 Pro:+8.3 分
更重要的是:K2.5 能穩定執行 200-300 個連續工具呼叫而不失去上下文。這是許多模型的弱點,也是 Agent 應用最怕踩的坑。
一位開發者的評價直接點出重點:
"Kimi K2 is so good at tool calling and agentic loops… It's the first model I feel comfortable using in production since Claude 3.5."
視覺能力
K2.5 原生支援多模態,可以把截圖或影片直接轉成可運行的前端程式碼。對 vibe coding 工作流很有用。
程式碼能力
- LiveCodeBench:85.0%(競爭性程式設計)
- SWE-Bench Multilingual:73.0%(多語言 codebase)
適合用在哪裡
適合:
- 需要大量 API 呼叫的自動化任務(省成本)
- Agent 工作流、工具呼叫密集的場景
- 有視覺需求的 vibe coding 工作流
- 預算有限的 indie builder 或一人 SaaS
不一定適合:
- 繁中長文寫作(中文能力仍以簡體為主)
- 需要 Anthropic 安全性保證的企業場景
- 已深度整合 Claude API 的現有產品(遷移成本)
怎麼開始用
最快的方式是透過 Kimi Code CLI 或直接呼叫 API:
# 安裝 Kimi Code CLI
npm install -g @moonshot/kimi-code
# 設定 API key
export KIMI_API_KEY=your_key_here
# 開始對話
kimi-code chat
或直接用 OpenAI 相容 API:
import OpenAI from 'openai'
const client = new OpenAI({
apiKey: process.env.KIMI_API_KEY,
baseURL: 'https://api.moonshot.cn/v1',
})
const response = await client.chat.completions.create({
model: 'kimi-k2-5',
messages: [{ role: 'user', content: '幫我寫一個 Next.js API route' }],
})
因為相容 OpenAI API,現有工具幾乎零改動就能切換。
我的結論
Kimi K2.5 是 2026 年開源 LLM 領域真正的破局者。
如果你的工作流以 agentic 任務、工具呼叫、或大量 API 請求為主,它的成本優勢幾乎無可抗拒。對於預算有限的 indie builder,這是一個值得認真評估的選項。
繁中寫作和深度推理我仍然信任 Claude,但批量處理、自動化 pipeline、vibe coding 輔助,Kimi K2.5 已經完全可以上場。
想深入了解如何把 LLM 整合進你的一人 SaaS 工作流?加入 akiraxtwo super,從工具選型到完整產品部署一次學完。