genai / news / / VentureBeat
Claude Opus 4.7 在關鍵基準測試中超越最直接競爭對手。
Anthropic 的 Claude Opus 4.7 引入自主自我驗證,減少代理任務中的幻覺循環。
重點
- Opus 4.7 在知識工作和代理程式碼基準中領先 GPT-5.4 與 Gemini 3.1 Pro,Elo 分數為 1753。
- 該模型現支援最高 2,576 像素的高解析度影像,視覺處理能力提升三倍。
- 新增「努力」參數與「任務預算」,允許用戶控制推理深度與代幣消耗。
- Opus 4.7 嚴格遵守指令,需大量重新調整提示,對舊有應用存在出錯風險。
相關公司
由 Newsio 自 VentureBeat 摘要整理。 摘要方式說明 →