Etiqueta

#blackwell

15 notas publicadas

NVIDIA cuantiza Nemotron 3 Ultra a NVFP4 con 5,9x más throughput

El equipo de NVIDIA reduce el checkpoint del modelo de 550B desde 1.121 GB en BF16 a 352 GB en NVFP4, con la técnica four-over-six que recupera 98,5% de la precisión sobre Blackwell.

NVIDIA Developerhace 3 días

AWS EC2 G7 estrena Blackwell con 4.6x mas inferencia que G6

Las nuevas instancias suman hasta 8 RTX PRO 4500 Blackwell, 256 GB de memoria GPU y 700 Gbps en EFA, y NVIDIA cuVS pasa a default en OpenSearch Serverless.

NVIDIA Bloghace 3 días

SpaceX renta GPUs por USD 28.000M, doble que Coreweave

El tercer contrato GPU de SpaceX, ahora con Reflection AI, lleva sus rentas anuales a USD 28.000 millones según Jamin Ball: doble de la facturación actual de Coreweave.

Latent Space23 jun

DFlash: hasta 15x más inferencia LLM en NVIDIA Blackwell

El método de speculative decoding por bloques desplaza a EAGLE-3 y libera 20 checkpoints abiertos en Hugging Face para Hopper y Blackwell.

NVIDIA Developer23 jun

NVIDIA Blackwell domina MLPerf Training 6.0 con 8.192 GPUs

Fue la única plataforma en presentar resultados sobre cada test, incluyendo DeepSeek-V3 (671B parámetros) y GPT-OSS-20B, y escaló a 8.192 GPUs Blackwell Ultra en datacenters de producción.

NVIDIA Developer17 jun

FP8 y NVFP4 en Transformers: hasta 3,48x con Blackwell B300

NVIDIA muestra cómo medir GEMM por GEMM la ganancia real de las precisiones bajas en CodonFM 5B, separando el costo de cuantización del rendimiento puro del kernel.

NVIDIA Developer17 jun

Blackwell barre MLPerf Training 6.0: NVIDIA escala a 8.192 GPU

GB200 NVL72 y GB300 NVL72 lideran las siete pruebas del benchmark, incluyendo las nuevas cargas MoE DeepSeek-V3 671B y GPT-OSS-20B, con CoreWeave entrenando en 2,02 minutos.

NVIDIA Blog17 jun

NVIDIA Blackwell lidera el primer benchmark de IA agéntica

El GB300 NVL72 corre 20× más agentes por megawatt que el HGX H200 en AgentPerf, el primer benchmark de Artificial Analysis que mide cargas reales de agentes encadenando llamadas LLM.

NVIDIA Blog13 jun

MiniMax M3: MoE de 428B con 1M de contexto en Blackwell

Sirve contextos de 1 millón de tokens con costo por token 20 veces menor que M2, y se despliega en NVIDIA Dynamo, TensorRT-LLM, SGLang y vLLM con pesos abiertos en Hugging Face.

NVIDIA Developer13 jun

Blackwell HGX B200 marca récord STAC-AI en finanzas

El benchmark STAC-AI LANG6 con Llama 3.1 8B y 70B muestra hasta 2,8x más rendimiento por GPU frente a Hopper en cargas de inferencia con documentos EDGAR.

NVIDIA Developer28 may

NVIDIA RTX PRO 4500 Blackwell: 2x más rápido en genómica y plegamiento

La nueva GPU Server Edition acelera Parabricks, Minimap2, fq2bam y DeepVariant; con cuEquivariance y Openfold3 también gana 2,3x sobre la L4 al inferir estructuras de proteínas.

NVIDIA Developer26 may

TLX Block Attention: 1,85x sobre Flash Attention v2 en NVIDIA B200

El kernel Triton desarrollado por Meta para GPUs Blackwell aprovecha el patrón block-diagonal de los modelos de ranking para eliminar pasos enteros del algoritmo y acelerar 2,50x el backward pass.

PyTorch Blog26 may

GB200 NVL72 + Slurm block scheduling: cómo no fragmentar jobs

El nuevo plugin topology/block de Slurm trata cada dominio NVLink coherente del rack como una unidad rígida, evitando que un job atraviese fronteras y pierda el ancho de banda de 1,8 TB/s por GPU.

NVIDIA Developer11 may

Electrónica

RTX Mega Geometry: -1 GB VRAM y +13% FPS en Alan Wake 2

Una Cluster Acceleration Structure reduce el costo de la BVH en ray tracing sobre geometría densa, y los RT Cores Blackwell duplican la tasa de intersección rayo-triángulo.

Tom's Hardware11 may

NVIDIA y Google Cloud impulsan la IA agéntica y física

La alianza presenta infraestructura Vera Rubin, GPUs Blackwell y nuevas herramientas para escalar gemelos digitales y agentes autónomos en la nube.

NVIDIA Blog26 abr

Etiquetas relacionadas

Otros temas que aparecen junto a #blackwell en nuestra cobertura editorial.

#Nvidia15 #LLM3 #Deepseek2 #mlperf2 #gb3002 #nvfp42 #Google Cloud1 #Ia Agentica1