genai / news / / The New Stack
Google 於三月推出 Android Bench 基準測試平台。
Android Bench 現在排名開放權重模型,並追蹤延遲、代幣數及每次運行成本。
重點
- GPT 5.5 目前領先,為 Android 應用開發任務中表現最佳的 AI 模型。
- Android Bench 使用來自公開 GitHub Android 倉庫的真實挑戰來評估大型語言模型(LLM)。
- Google 在 GitHub 上公開發布其 Android Bench 測試框架及評分方法。
相關公司
由 Newsio 自 The New Stack 摘要整理。 摘要方式說明 →