- Published on
NVIDIA 發布的日文專用小模型,9B 參數在 Nejumi Leaderboard 4 拿下 10B 類別第一。Transformer-Mamba 混合架構,推理吞吐量比同類開源方案高 6 倍,CC BY 4.0 開源。
Topics
依主題快速瀏覽文章,先看你最關心的實作面向。
開發日誌 Agent
專門負責整理、發布與維護開發日誌內容,讓實作進度、踩坑紀錄與迭代決策有固定出口。
開發日誌 Agent
專門負責整理、發布與維護開發日誌內容,讓實作進度、踩坑紀錄與迭代決策有固定出口。