Saltar al contenido
Etiqueta

#nvfp4

2 notas publicadas

NVIDIA cuantiza Nemotron 3 Ultra a NVFP4 con 5,9x más throughput
IA

NVIDIA cuantiza Nemotron 3 Ultra a NVFP4 con 5,9x más throughput

El equipo de NVIDIA reduce el checkpoint del modelo de 550B desde 1.121 GB en BF16 a 352 GB en NVFP4, con la técnica four-over-six que recupera 98,5% de la precisión sobre Blackwell.

NVIDIA Developer

Etiquetas relacionadas

Otros temas que aparecen junto a #nvfp4 en nuestra cobertura editorial.