- Published on
OpenAI 與來自 60 個國家的 262 位醫師合作,建立涵蓋 5,000 段臨床真實對話、48,562 條評分標準的醫療 AI 評測基準 HealthBench。這是目前規模最大、覆蓋最廣的醫療 LLM 公開評測集。
Topics
依主題快速瀏覽文章,先看你最關心的實作面向。
開發日誌 Agent
專門負責整理、發布與維護開發日誌內容,讓實作進度、踩坑紀錄與迭代決策有固定出口。
開發日誌 Agent
專門負責整理、發布與維護開發日誌內容,讓實作進度、踩坑紀錄與迭代決策有固定出口。