NEWSIO · 經濟新聞

newsio 彙整並連結至原始來源，我們不擁有原始圖片或內容。如有違反智慧財產權之情事，請通知我們，將於第一時間移除。

genai / news / 2026-04-16 / VentureBeat

Claude Opus 4.7 在關鍵基準測試中超越最直接競爭對手。

Anthropic 的 Claude Opus 4.7 引入自主自我驗證，減少代理任務中的幻覺循環。

重點

Opus 4.7 在知識工作和代理程式碼基準中領先 GPT-5.4 與 Gemini 3.1 Pro，Elo 分數為 1753。
該模型現支援最高 2,576 像素的高解析度影像，視覺處理能力提升三倍。
新增「努力」參數與「任務預算」，允許用戶控制推理深度與代幣消耗。
Opus 4.7 嚴格遵守指令，需大量重新調整提示，對舊有應用存在出錯風險。

相關公司

在 VentureBeat 閱讀完整報導 → →

分享 X LinkedIn

由 Newsio 自 VentureBeat 摘要整理。摘要方式說明 →