semiconductor / news / / TNW
Nemotron 3 Nano Omni 整合了視覺、音訊和語言功能,採用 30 億引數的單一架構,但每次運算時僅使用 3 億引數。
Nvidia 的 Nemotron 3 Nano Omni 將視覺、聽覺和語言整合到一個只有 30 億引數的單一模型中。
重點
- 該模型僅使用 3 億個活躍引數進行推理,使其能夠在單個 GPU 上進行部署。
- Nemotron 3 Nano Omni 宣稱其處理速度可達 9 倍,推理速度比同型別的多模態模型快 2.9 倍。
- 這是一個首個結合混合專家、統一架構和音訊能力的開源多模態模型。
- 此模型可在 NVIDIA 的開放模型協議下使用,允許完全的商業用途,並且可以在多個框架中使用。
相關公司
由 Newsio 自 TNW 摘要整理。 摘要方式說明 →