NEWSIO · 經濟新聞

newsio 彙整並連結至原始來源，我們不擁有原始圖片或內容。如有違反智慧財產權之情事，請通知我們，將於第一時間移除。

semiconductor / news / 2026-04-28 / TNW

Nemotron 3 Nano Omni 整合了視覺、音訊和語言功能，採用 30 億引數的單一架構，但每次運算時僅使用 3 億引數。

Nvidia 的 Nemotron 3 Nano Omni 將視覺、聽覺和語言整合到一個只有 30 億引數的單一模型中。

重點

該模型僅使用 3 億個活躍引數進行推理，使其能夠在單個 GPU 上進行部署。
Nemotron 3 Nano Omni 宣稱其處理速度可達 9 倍，推理速度比同型別的多模態模型快 2.9 倍。
這是一個首個結合混合專家、統一架構和音訊能力的開源多模態模型。
此模型可在 NVIDIA 的開放模型協議下使用，允許完全的商業用途，並且可以在多個框架中使用。

相關公司

在 TNW 閱讀完整報導 → →

分享 X LinkedIn

由 Newsio 自 TNW 摘要整理。摘要方式說明 →