跳到主要內容

akiraxtwo super

AI 工具觀察與實作筆記。

給開發者、創作者與工具重度使用者的長文整理。

Latest

music-generationdiffusionopen-source

ACE-Step 1.5:A100 上 2 秒生一首歌,開源音樂生成現在能做到什麼程度

ACE-Step 1.5 是 ACE Studio 與 StepFun 聯合開源的音樂生成模型,A100 上單首歌不到 2 秒,RTX 3090 也在 10 秒內,支援 50+ 語言、1000+ 樂器、文字直接轉完整歌曲,MIT 授權。

andrej-karpathy-skills:一份 Markdown 檔案,45k stars,重新定義 AI 寫程式的行為邊界

Forrest Chang 把 Karpathy 對 LLM coding 的批評濃縮成一份 CLAUDE.md,四條原則約束 Claude Code 不再替你亂假設、亂重構。45.9k stars 證明:約束比能力更重要。

Anthropic 讓 AI 自己研究 AI 安全:PGR 0.97 vs 人類 0.23,但它也嘗試作弊

Anthropic 最新研究讓 9 個 Claude Opus 4.6 agent 並行做 alignment 研究,7 天內恢復 97% 的績效落差,遠勝人類研究員的 23%。但同一批 agent 也主動嘗試對評估指標動手腳。這個矛盾才是這篇論文最值得討論的地方。

career-ops:用 Claude Code 全自動求職,作者靠它拿下自己的工作

Santiago 把整個求職流程自動化——Playwright 掃描 45 家以上公司、Go TUI dashboard 即時追蹤、ATS 最佳化的 PDF 履歷自動生成。33.8k stars 的 career-ops 不是玩具,作者用它找到了自己現在的工作。

49 個 AI Agent 組成的遊戲工作室:Claude Code Game Studios 讓你一個人跑完整個開發流程

一套 Shell template,把 Claude Code 變成有 49 個 Agent、三層組織架構的遊戲開發工作室。支援 Godot、Unity、Unreal Engine 5。

VideoRAG:單張 RTX 3090 跑 100 小時影片問答,KDD 2026 長影片 RAG 系統

香港大學 HKUDS 實驗室在 KDD 2026 發表的 VideoRAG,用雙通道架構——多模態知識圖譜 + 分層時空語境編碼——讓單張 RTX 3090 就能對 100 小時以上的影片進行自然語言問答,Video-MME 長影片 60.2% 準確率。

準備好深入了嗎?下一站是 docs。

blog 負責整理入口,docs 負責帶你真正走進去。免費加入即可閱讀完整教學、跟著學習路徑前進,訂閱後還能解鎖影片與進階內容。

登入看完整教學