Saltar al contenido
Etiqueta

#nvidia

60 notas publicadas

NVIDIA AI-Q 2.0 llega a Oracle Cloud con un Blueprint listo en 25 minuto
IA

NVIDIA AI-Q 2.0 llega a Oracle Cloud con un Blueprint listo en 25 minuto

El blueprint open source para agentes de IA de NVIDIA ya tiene una receta lista para Oracle Cloud Infrastructure: Terraform crea el clúster OKE y Helm instala backend, frontend y PostgreSQL.

NVIDIA Developer
NVIDIA cuantiza Nemotron 3 Ultra a NVFP4 con 5,9x más throughput
IA

NVIDIA cuantiza Nemotron 3 Ultra a NVFP4 con 5,9x más throughput

El equipo de NVIDIA reduce el checkpoint del modelo de 550B desde 1.121 GB en BF16 a 352 GB en NVFP4, con la técnica four-over-six que recupera 98,5% de la precisión sobre Blackwell.

NVIDIA Developer
OpenAI presenta Jalapeño, su primer chip de IA hecho con Broadcom
IA

OpenAI presenta Jalapeño, su primer chip de IA hecho con Broadcom

El ASIC diseñado a medida para inferencia llega nueve meses después del anuncio de la sociedad y promete rendimiento por watt mayor al estado del arte actual, según OpenAI.

The Verge
AWS EC2 G7 estrena Blackwell con 4.6x mas inferencia que G6
IA

AWS EC2 G7 estrena Blackwell con 4.6x mas inferencia que G6

Las nuevas instancias suman hasta 8 RTX PRO 4500 Blackwell, 256 GB de memoria GPU y 700 Gbps en EFA, y NVIDIA cuVS pasa a default en OpenSearch Serverless.

NVIDIA Blog
NVIDIA estrena descriptor heaps de Vulkan en sus drivers 610
IA

NVIDIA estrena descriptor heaps de Vulkan en sus drivers 610

VK_EXT_descriptor_heap simplifica la asignacion de recursos para ray tracing y dynamic texture indexing, y trae paridad con D3D12 a los desarrolladores graficos en NVIDIA.

NVIDIA Developer
NVIDIA apunta a 25% menos energía en entrenamiento con DSX y NVFP4
IA

NVIDIA apunta a 25% menos energía en entrenamiento con DSX y NVFP4

La compañía propone un stack completo para que las fábricas de IA optimicen tokens por watt, desde 45°C de refrigeración líquida hasta scheduling consciente de energía.

NVIDIA Developer
TensorRT 11.0 escala inferencia IA multi-GPU con NCCL nativo
IA

TensorRT 11.0 escala inferencia IA multi-GPU con NCCL nativo

El nuevo soporte multi-device del runtime habilita paralelismo de tensor y de contexto, y los benchmarks colocan a DeepSpeed Ulysses como la mejor estrategia para diffusion con secuencias largas.

NVIDIA Developer
NVIDIA Rubin recorta el consumo de agua a casi cero subiendo la temperat
IA

NVIDIA Rubin recorta el consumo de agua a casi cero subiendo la temperat

El diseño de referencia para la nueva generación de data centers Rubin pasa al refrigerado 100% líquido y opera los servidores hasta a 45 grados, según el head de sustentabilidad de NVIDIA.

The Verge
BEVPoolV3 acelera percepción de IA física hasta 42x en GPU
IA

BEVPoolV3 acelera percepción de IA física hasta 42x en GPU

NVIDIA detalla cuatro cambios algorítmicos al pooling BEV que llevan la latencia de 274 µs a 16,4 µs en RTX PRO 6000 Blackwell Max-Q gracias a FP8 y mejor uso de caché L2.

NVIDIA Developer
NVIDIA Agent Toolkit empaqueta Nemotron, NemoClaw y OpenShell
IA

NVIDIA Agent Toolkit empaqueta Nemotron, NemoClaw y OpenShell

La pila reúne modelos abiertos, blueprints y runtime seguro en un mismo stack para que empresas construyan agentes IA especializados sin depender de terceros.

NVIDIA Blog
NVIDIA NemoClaw habilita agentes IA 24/7 en telcos
IA

NVIDIA NemoClaw habilita agentes IA 24/7 en telcos

En el DTW Ignite 2026 en Copenhague, la compañía muestra junto a Amdocs, ServiceNow, NTT DATA y TCS un runtime seguro (OpenShell) que orquesta agentes con políticas y sandboxing para redes 5G y 6G.

NVIDIA Blog
NVIDIA cuPhoton acelera 14.900x imágenes del Rubin Observatory
IA

NVIDIA cuPhoton acelera 14.900x imágenes del Rubin Observatory

Junto a ALCHEMI y DAQIRI, la compañía presenta en ISC Hamburgo un trío de bibliotecas CUDA-X para astronomía, simulación de materiales y adquisición de datos.

NVIDIA Blog
Nvidia copa el 81% del TOP500 y arrasa en el Green500
IA

Nvidia copa el 81% del TOP500 y arrasa en el Green500

El ranking de junio del ISC en Hamburgo muestra que 9 de cada 10 sistemas nuevos del TOP500 corren sobre tecnología Nvidia, con KAIROS liderando eficiencia a 73,3 gigaflops por watt.

NVIDIA Blog
Nvidia recorta hasta 100% del agua con refrigeración a 45°C
Electrónica

Nvidia recorta hasta 100% del agua con refrigeración a 45°C

El nuevo sistema corre con 75% agua y 25% propilenglicol entrando a 45°C, suficiente para enfriar los chips Rubin sin chillers la mayor parte del año.

Tom's Hardware
NVIDIA BioNeMo duplica la eficiencia de los agentes científicos
IA

NVIDIA BioNeMo duplica la eficiencia de los agentes científicos

El Agent Toolkit empaqueta OpenFold3, DiffDock, GenMol, Evo 2 y Parabricks como herramientas callable por agentes vía Model Context Protocol, sobre NIM hosted o local.

NVIDIA Developer
SpaceX renta GPUs por USD 28.000M, doble que Coreweave
IA

SpaceX renta GPUs por USD 28.000M, doble que Coreweave

El tercer contrato GPU de SpaceX, ahora con Reflection AI, lleva sus rentas anuales a USD 28.000 millones según Jamin Ball: doble de la facturación actual de Coreweave.

Latent Space
DFlash: hasta 15x más inferencia LLM en NVIDIA Blackwell
IA

DFlash: hasta 15x más inferencia LLM en NVIDIA Blackwell

El método de speculative decoding por bloques desplaza a EAGLE-3 y libera 20 checkpoints abiertos en Hugging Face para Hopper y Blackwell.

NVIDIA Developer
NVIDIA DAQIRI canaliza datos de sensores directo a la GPU sin kernel
IA

NVIDIA DAQIRI canaliza datos de sensores directo a la GPU sin kernel

La librería del Holoscan Platform usa DPDK y GPUDirect para canalizar streams de cientos de Gbps al tensor en GPU sin copias intermedias, con caso de uso en el HL-LHC del CERN.

NVIDIA Developer
NVIDIA Halos lleva la seguridad funcional de los autos a los robots
IA

NVIDIA Halos lleva la seguridad funcional de los autos a los robots

El stack combina IGX Thor con un sistema operativo certificable IEC 61508 SIL 3 y promete acortar la certificación de humanoides y AMR con Agility y Boston Dynamics como primeros usuarios.

NVIDIA Developer
Groq levanta USD 650M tras el not-acqui-hire de NVIDIA
IA

Groq levanta USD 650M tras el not-acqui-hire de NVIDIA

Seis meses después de licenciar su IP de LPU a NVIDIA y perder a su fundador, la chipmaker apuesta por su negocio neocloud con 13 data centers y nuevos ejecutivos al timón.

TechCrunch AI
JUPITER en ISC: cerebro, clima y simulación cuántica de 50 qubits
IA

JUPITER en ISC: cerebro, clima y simulación cuántica de 50 qubits

El primer exascale europeo, en Forschungszentrum Jülich, mostró cuatro hitos: foundation model del cerebro, clima global a 1 km, IA para 6G y récord en simulación cuántica.

NVIDIA Blog
NVIDIA Rubin enfría con líquido a 45°C y sin ventiladores
IA

NVIDIA Rubin enfría con líquido a 45°C y sin ventiladores

La nueva generación de infraestructura de IA es la primera 100% refrigerada por líquido, opera con coolant a 45°C y puede reducir el consumo de agua del centro de datos a casi cero.

NVIDIA Blog
NVIDIA Vera CPU abre la era de IA agéntica científica en Los Alamos
IA

NVIDIA Vera CPU abre la era de IA agéntica científica en Los Alamos

Los nuevos supercomputadores Mission, Vision y Veritas combinarán Vera Rubin con HPE Cray GX5000 para potenciar agentes científicos como URSA y descargar trabajo desde Crossroads.

NVIDIA Blog
CCCL Runtime: NVIDIA propone una capa C++ moderna para CUDA
IA

CCCL Runtime: NVIDIA propone una capa C++ moderna para CUDA

Headers como cuda/stream, cuda/buffer y cuda/launch ofrecen tipos fuertes, dependencias explícitas y APIs asíncronas por defecto, sin reescribir el código que usa CUDA Runtime.

NVIDIA Developer
Servidores Arm superan 45% del mercado data center y empujan a x86
Electrónica

Servidores Arm superan 45% del mercado data center y empujan a x86

Los datos de IDC del primer trimestre 2026 muestran ingresos récord de USD 122.600 millones; las máquinas aceleradas con GPU, ASIC y FPGA generan más del 70% de la facturación global.

Tom's Hardware
NVIDIA Halos: stack completo de seguridad para robots industriales
Robótica

NVIDIA Halos: stack completo de seguridad para robots industriales

Adoptado por Agility Robotics para sus humanoides Digit en Amazon, GXO y Toyota; combina IGX Thor, Halos Core y un laboratorio acreditado por ANAB.

The Robot Report
NVIDIA Vera vs Ampere Altra Max: benchmarks ARM en Linux
Electrónica

NVIDIA Vera vs Ampere Altra Max: benchmarks ARM en Linux

Phoronix midió la CPU Olympus de 88 núcleos frente al SoC Altra Max de 128 Neoverse-N1, en igual stack Ubuntu 24.04 LTS sobre System76 Thelio Astra.

Phoronix Tests
Tesla Megapod: hardware modular para datacenters de IA
Electrónica

Tesla Megapod: hardware modular para datacenters de IA

La marca registra el nombre menos de un año después del cierre de Dojo y apunta a un mercado dominado por Nvidia y su sistema NVL72.

Electrek
DLSS llega al driver open source NVK para Nvidia en Linux
Electrónica

DLSS llega al driver open source NVK para Nvidia en Linux

El parche aterriza en Mesa 26.2-devel detrás de la bandera NVK_EXPERIMENTAL=dlss y carga los binarios CUDA precompilados de Nvidia en lugar de reimplementar el upscaler.

Tom's Hardware
AWS evalua vender Trainium para disputarle USD 50B a Nvidia
IA

AWS evalua vender Trainium para disputarle USD 50B a Nvidia

Peter DeSantis confirmo a Bloomberg que Amazon negocia vender sus chips Trainium a otros datacenters, un mercado que Andy Jassy estimo en USD 50.000 millones anuales si AWS dejara de consumirlo todo.

TechCrunch AI
NVIDIA ENPIRE: robots aprenden solos a instalar GPUs
Electrónica

NVIDIA ENPIRE: robots aprenden solos a instalar GPUs

El framework entrega una flota de robots y un presupuesto de tokens a 8 agentes Codex para que descubran solos cómo alinear conectores PCIe, ordenar pines metálicos y cortar zip ties.

Tom's Hardware
HPE AI Factory con NVIDIA suma Vera CPU y Agent Toolkit
IA

HPE AI Factory con NVIDIA suma Vera CPU y Agent Toolkit

En HPE Discover Las Vegas, NVIDIA y HPE anuncian la CPU Vera para los ProLiant DL394 Gen12 en 2027, el Agent Toolkit con Nemotron y NemoClaw, y Confidential Computing en todo el portafolio.

NVIDIA Blog
NVIDIA XR AI: librería abierta para agentes en gafas AR
IA

NVIDIA XR AI: librería abierta para agentes en gafas AR

El stack llega en beta pública con Cosmos para visión, Nemotron para lenguaje, MCP para datos empresariales y NeMo Agent Toolkit para orquestación, todo bajo licencia abierta en GitHub.

NVIDIA Developer
SMI alinea su SSD PCIe 6.0 con NVIDIA, no con Intel ni AMD
Electrónica

SMI alinea su SSD PCIe 6.0 con NVIDIA, no con Intel ni AMD

Silicon Motion apunta a fines de 2027 para su plataforma cliente de PCIe Gen6, empujada por la hambre de ancho de banda de los chips RTX Spark y GB10.

Tom's Hardware
ENPIRE: NVIDIA hace que ocho robots se entrenen solos al 99% con agentes
IA

ENPIRE: NVIDIA hace que ocho robots se entrenen solos al 99% con agentes

El proyecto con Carnegie Mellon y UC Berkeley pone a Codex, Claude Code y Kimi Code a escribir el código de entrenamiento, leer papers y coordinar una flota completa por Git.

The Decoder
NVIDIA libera ACE Game Agent SDK para NPCs en Unreal Engine 5
IA

NVIDIA libera ACE Game Agent SDK para NPCs en Unreal Engine 5

El framework abierto en C/C++ permite construir companions on-device con ASR, SLM y TTS, ya probado en PUBG: BATTLEGROUNDS y Total War: PHARAOH sobre hardware GeForce RTX.

NVIDIA Developer
NVIDIA Blackwell domina MLPerf Training 6.0 con 8.192 GPUs
IA

NVIDIA Blackwell domina MLPerf Training 6.0 con 8.192 GPUs

Fue la única plataforma en presentar resultados sobre cada test, incluyendo DeepSeek-V3 (671B parámetros) y GPT-OSS-20B, y escaló a 8.192 GPUs Blackwell Ultra en datacenters de producción.

NVIDIA Developer
NVIDIA libera receta para entrenar tu propio modelo de transacciones
IA

NVIDIA libera receta para entrenar tu propio modelo de transacciones

El workflow Build Your Own Transaction Model combina cuDF, cuML y NeMo AutoModel para llegar a un Llama de 29M parámetros que mejora 50% la precisión sobre XGBoost en detección de fraude.

NVIDIA Developer
FP8 y NVFP4 en Transformers: hasta 3,48x con Blackwell B300
IA

FP8 y NVFP4 en Transformers: hasta 3,48x con Blackwell B300

NVIDIA muestra cómo medir GEMM por GEMM la ganancia real de las precisiones bajas en CodonFM 5B, separando el costo de cuantización del rendimiento puro del kernel.

NVIDIA Developer
Blackwell barre MLPerf Training 6.0: NVIDIA escala a 8.192 GPU
IA

Blackwell barre MLPerf Training 6.0: NVIDIA escala a 8.192 GPU

GB200 NVL72 y GB300 NVL72 lideran las siete pruebas del benchmark, incluyendo las nuevas cargas MoE DeepSeek-V3 671B y GPT-OSS-20B, con CoreWeave entrenando en 2,02 minutos.

NVIDIA Blog
NVIDIA acelera el entrenamiento MoE hasta 93% con kernels CuTe DSL
IA

NVIDIA acelera el entrenamiento MoE hasta 93% con kernels CuTe DSL

Los kernels fusionados eliminan cuellos de botella de memoria y sincronización CPU-GPU, entregan speedup de 1,3× a 2× por kernel y mejoran 93% el pre-entrenamiento de GPT-OSS.

NVIDIA Developer
NVIDIA BioNeMo Recipes: LoRA entrena modelos biológicos en una sola GPU
IA

NVIDIA BioNeMo Recipes: LoRA entrena modelos biológicos en una sola GPU

El framework abierto de NVIDIA permite afinar ESM2-3B (proteínas) y Evo2-1B (ADN) entrenando apenas 1% de los parámetros y obteniendo precisión equivalente al fine-tuning completo.

NVIDIA Developer
World-Action Models: la nueva ola IA para robótica generalista
IA

World-Action Models: la nueva ola IA para robótica generalista

Investigadores de NVIDIA mapean cómo los video-backbones (Cosmos Policy, DreamZero) compiten con la receta VLM-VLA dominante en GR00T y Pi-0 para entrenar policies generalistas en humanoides y cobots.

NVIDIA Developer
Microsoft prueba Copilot+ con GPUs discretas en vez de NPUs
Electrónica

Microsoft prueba Copilot+ con GPUs discretas en vez de NPUs

Un SDK experimental de Windows ya permite correr Language Model APIs sobre tarjetas Nvidia RTX 30-series con al menos 6 GB de VRAM, abriendo la IA local a desktops sin chip dedicado.

Tom's Hardware
NVIDIA venderá CPUs Vera a China desde agosto pese al freno de las GPUs
Electrónica

NVIDIA venderá CPUs Vera a China desde agosto pese al freno de las GPUs

Mientras los envíos de H200 siguen frenados, NVIDIA invita a clientes chinos a tomar pedidos de Vera con shipping en agosto. Más de 300 servidores Vera ya están en pruebas.

Tom's Hardware
NVIDIA SCADA: Wiwynn arma servidor de 2,9 PB y 528M IOPS
Electrónica

NVIDIA SCADA: Wiwynn arma servidor de 2,9 PB y 528M IOPS

El primer servidor SCaled Accelerated Data Access para IA empaca 96 SSDs PCIe 6.0 Micron 9650 Pro, CPU NVIDIA Vera y cuatro RTX Pro 6000 Blackwell en 6U.

Tom's Hardware
NVIDIA GB300 NVL72 rinde 20x más agentes que H200 en AA-AgentPerf
IA

NVIDIA GB300 NVL72 rinde 20x más agentes que H200 en AA-AgentPerf

Artificial Analysis estrenó el primer benchmark multi-vendor que mide rendimiento concurrente de agentes de IA en cargas reales de coding, con resultados normalizados por acelerador y por megawatt.

NVIDIA Developer
Nebius y NVIDIA abren un Living Lab de IA física en Londres
Electrónica

Nebius y NVIDIA abren un Living Lab de IA física en Londres

Programa de seis meses para startups británicas y europeas de robótica que combina la nube AI de Nebius con la pila completa de NVIDIA, incluyendo Cosmos, Isaac y GPUs RTX PRO.

Electronics Weekly
NVIDIA Blackwell lidera el primer benchmark de IA agéntica
IA

NVIDIA Blackwell lidera el primer benchmark de IA agéntica

El GB300 NVL72 corre 20× más agentes por megawatt que el HGX H200 en AgentPerf, el primer benchmark de Artificial Analysis que mide cargas reales de agentes encadenando llamadas LLM.

NVIDIA Blog
MiniMax M3: MoE de 428B con 1M de contexto en Blackwell
IA

MiniMax M3: MoE de 428B con 1M de contexto en Blackwell

Sirve contextos de 1 millón de tokens con costo por token 20 veces menor que M2, y se despliega en NVIDIA Dynamo, TensorRT-LLM, SGLang y vLLM con pesos abiertos en Hugging Face.

NVIDIA Developer
Taiwán evalúa criminalizar exportaciones de chips de IA a China
Electrónica

Taiwán evalúa criminalizar exportaciones de chips de IA a China

El gobierno de Taipei discute extender las restricciones más allá de las firmas en lista negra y enjuiciar el contrabando como delito penal por primera vez, según Bloomberg.

Tom's Hardware
SpaceX detalla AI1: datacenter orbital de 150 kW a 3 días del IPO
Electrónica

SpaceX detalla AI1: datacenter orbital de 150 kW a 3 días del IPO

El satélite con envergadura de 70 metros (mayor que la de un Boeing 747-8) aloja un payload de compute equivalente a un rack Nvidia GB300, orbita a 600 km y deja elegir el chipmaker.

Tom's Hardware
DiffusionGemma de Google escribe texto desde ruido a 1.000 tokens/s
IA

DiffusionGemma de Google escribe texto desde ruido a 1.000 tokens/s

El modelo experimental de pesos abiertos genera 256 tokens en paralelo y supera a Gemma 4 en velocidad, aunque pierde calidad en los benchmarks de Google.

The Decoder
Por qué la robótica no tendrá un momento Llama tan limpio
Robótica

Por qué la robótica no tendrá un momento Llama tan limpio

Las políticas robóticas se pueden descargar como pesos, pero recién valen algo cuando el controlador, la celda física y los datos de falla las convierten en trabajo repetible sobre el robot instalado.

The Robot Report
AMD dice que Zen 6 Venice de 256 cores supera 3,3 veces a Nvidia Vera
Electrónica

AMD dice que Zen 6 Venice de 256 cores supera 3,3 veces a Nvidia Vera

Los primeros benchmarks estimados del EPYC Venice apuntan a una superioridad a escala de rack con presupuesto de 100kW. El catch: AMD no testeó Vera, son modelos basados en datos de Phoronix.

Tom's Hardware
Centros de datos en órbita: el desafío térmico real
Robótica

Centros de datos en órbita: el desafío térmico real

La idea de llevar la computación a la órbita terrestre enfrenta barreras físicas infranqueables. La radiación y la falta de atmósfera complican la gestión térmica.

IEEE Spectrum
DiffusionGemma: IA de alto rendimiento en hardware NVIDIA
IA

DiffusionGemma: IA de alto rendimiento en hardware NVIDIA

Google DeepMind y NVIDIA optimizan la generación de texto paralela, logrando mayor throughput y menores costos operativos para aplicaciones empresariales de IA.

NVIDIA Developer
Lemonade 10.7 de AMD suma soporte CUDA para GPU NVIDIA
Open Source

Lemonade 10.7 de AMD suma soporte CUDA para GPU NVIDIA

El servidor local de IA open source de AMD ahora detecta GPU NVIDIA en Windows y Linux vía Llama.cpp y stable-diffusion.cpp, y agrega benchmarks comparables entre runtimes.

Phoronix Tests
DiffusionGemma: generación de texto 4 veces más rápida
IA

DiffusionGemma: generación de texto 4 veces más rápida

Google DeepMind publica un modelo experimental MoE de 26B parámetros bajo Apache 2.0 que genera bloques de 256 tokens en paralelo, alcanzando 1.000 tok/s en una NVIDIA H100.

Google DeepMind
GCC: parche de NVIDIA acelera el bootstrap en un 43%
Open Source

GCC: parche de NVIDIA acelera el bootstrap en un 43%

El ingeniero Kyrylo Tkachov presentó una mejora para el compilador GNU que reduce drásticamente los tiempos de compilación nativa en entornos AArch64.

Phoronix Tests

Etiquetas relacionadas

Otros temas que aparecen junto a #nvidia en nuestra cobertura editorial.