NEWSIO · 經濟新聞

newsio 彙整並連結至原始來源，我們不擁有原始圖片或內容。如有違反智慧財產權之情事，請通知我們，將於第一時間移除。

genai / news / 2024-08-02 / Analytics India Magazine

蘋果研究人員發表了大規模多任務代理理解（MMAU）基準。

蘋果推出MMAU基準，以評估大型語言模型在五個專業領域的五項能力。

重點

MMAU包含20項任務及超過3,000個提示，能比以往基準提供更細緻的評估。
GPT-4及其他基於API的模型在挑戰性領域中持續優於開源模型。
自我修正仍是重大挑戰，而解決問題能力則是目前大型語言模型較普遍能達成的目標。
蘋果同時推出LazyLLM，一種在不犧牲準確度下加速大型語言模型推理的新技術。

相關公司

在 Analytics India Magazine 閱讀完整報導 → →

分享 X LinkedIn

由 Newsio 自 Analytics India Magazine 摘要整理。摘要方式說明 →