# Nemotron 3 Nano Omni 整合了視覺、音訊和語言功能，採用 30 億引數的單一架構，但每次運算時僅使用 3 億引數。

*semiconductor · news · 2026-04-28 · TNW*

## Key points

- Nvidia 的 Nemotron 3 Nano Omni 將視覺、聽覺和語言整合到一個只有 30 億引數的單一模型中。
- 該模型僅使用 3 億個活躍引數進行推理，使其能夠在單個 GPU 上進行部署。
- Nemotron 3 Nano Omni 宣稱其處理速度可達 9 倍，推理速度比同型別的多模態模型快 2.9 倍。
- 這是一個首個結合混合專家、統一架構和音訊能力的開源多模態模型。
- 此模型可在 NVIDIA 的開放模型協議下使用，允許完全的商業用途，並且可以在多個框架中使用。

**Companies:** 英偉達, 亞馬遜, 富士康, Palantir, 戴爾, DocuSign, 英法思, 奧拉庫, 艾比爾, 亞洲, 伊卡護理, H 公司
**Countries:** 美國, 臺灣

[Read the full story on TNW](https://thenextweb.com/news/nvidia-nemotron-nano-omni-multimodal-agent-edge)

---

Canonical: https://newsio.io/zh-TW/n/9ae296fc-7d4f-43fd-9bb1-ef08bd1dbc24/nemotron-3-nano-omni-30-3-9
Summarized by Newsio from TNW. https://newsio.io/how-it-works
