
NVIDIA cuantiza Nemotron 3 Ultra a NVFP4 con 5,9x más throughput
El equipo de NVIDIA reduce el checkpoint del modelo de 550B desde 1.121 GB en BF16 a 352 GB en NVFP4, con la técnica four-over-six que recupera 98,5% de la precisión sobre Blackwell.
8 notas publicadas

La pila reúne modelos abiertos, blueprints y runtime seguro en un mismo stack para que empresas construyan agentes IA especializados sin depender de terceros.

Nathan Lambert y Finbarr Timbers repasan en Interconnects cómo MiMo Flash v2, DeepSeek V4 y Nemotron 3 Ultra adoptaron destilación on-policy con múltiples profesores en lugar de un único RL gigante.

El nuevo modelo Mixture-of-Experts de NVIDIA promete mayor velocidad, eficiencia en contextos largos y una arquitectura diseñada para flujos de trabajo complejos.

El toolkit Model Card Generator de NVIDIA construye documentación completa en formato Model Card++ a partir del código fuente, con 91% de completitud y 76% de precisión en menos de un minuto.

El modelo procesa texto, imagen, video y audio con 30 mil millones de parámetros y se entrenó con datos sintéticos de Qwen, GPT-OSS, Kimi y DeepSeek-OCR.

Nvidia presenta NemoClaw, una implementación de referencia que despliega OpenClaw, OpenShell y modelos Nemotron con configuraciones de seguridad endurecidas para empresas.

El nuevo modelo de 30B con arquitectura mixture-of-experts apunta a reemplazar las pilas fragmentadas de visión, voz y lenguaje dentro de los sistemas agénticos.
Otros temas que aparecen junto a #nemotron en nuestra cobertura editorial.