semiconductor / news / / Wccftech
DeepSeek V4 已經發布,帶來了重大最佳化,包括最高可達 1.6TB 的模型大小。
DeepSeek V4 引入了 1.6 萬億引數的 Pro 級模型,以及 284 億引數的 Flash 版本。
重點
- V4 在處理 1 萬個 token 的語境時,將單個 token 的運算 FLOPs 減少到 27%,並將 KV 快取減少到 10%。
- NVIDIA Blackwell 顯示卡,能夠在發布之初支援 DeepSeek V4,每張顯示卡可達約 3500 萬次每秒 (TPS) 的處理速度。
- DeepSeek V4 採用 FP4 (MXFP4) 量化技術,可以實現更快的部署速度、更低的記憶體流量和更低的延遲。
- 華為的 2026 年 Ascend 950PR 和 950DT 晶片將支援 MXFP4,從而確保與 DeepSeek V4 的相容性。
相關公司
由 Newsio 自 Wccftech 摘要整理。 摘要方式說明 →