Login
Sign Up For Free
English
中文 (繁體)
中文 (香港)
中文 (简体)
日本語
Filipino
Bahasa Indonesia
Bahasa Melayu
Pусский
Português (Brasil)
Magyar
Français
Español
Deutsch
Čeština
العربية
Català
Dansk
Ελληνικά
فارسی
Suomi
Gaeilge
Hindi
עברית
Hrvatski
Italiano
Norsk bokmål
Nederlands
한국어
Polski
Română
Slovenský
Svenska
Türkçe
українська
беларуская
ไทย
Standard view
Ddavid
4 weeks ago
#AI
NVIDIA 發展只用 fp4 訓練而相較於 fp8 幾乎沒有損失正確性,也就是記憶體用量只需要幾乎一半,速度快 2 到 3 倍。
使用了四項保持正確性的技術,缺一不可(實驗中移除其中任何一項都會導致正確性大跌)。另外最終模型中仍會保留 10-15% 的 fp16 層以維持穩定性。
God of Prompt (@godofprompt) on X
掰噗~
說
4 weeks ago
OH NO!!
Ddavid
4 weeks ago
而 NVIDIA Blackwell 有原生支援 4 bits 加速(包括基礎的 4 bits、舊式的 MXFP4 以及他們這技術提出的 NVFP4),這進一步強化了優勢。
立即下載
delete
reply
edit
cancel
cancel