Etiqueta

#nvidia

60 notas publicadas

NVIDIA AI-Q 2.0 llega a Oracle Cloud con un Blueprint listo en 25 minuto

El blueprint open source para agentes de IA de NVIDIA ya tiene una receta lista para Oracle Cloud Infrastructure: Terraform crea el clúster OKE y Helm instala backend, frontend y PostgreSQL.

NVIDIA Developerhace 2 días

NVIDIA cuantiza Nemotron 3 Ultra a NVFP4 con 5,9x más throughput

El equipo de NVIDIA reduce el checkpoint del modelo de 550B desde 1.121 GB en BF16 a 352 GB en NVFP4, con la técnica four-over-six que recupera 98,5% de la precisión sobre Blackwell.

NVIDIA Developerhace 3 días

OpenAI presenta Jalapeño, su primer chip de IA hecho con Broadcom

El ASIC diseñado a medida para inferencia llega nueve meses después del anuncio de la sociedad y promete rendimiento por watt mayor al estado del arte actual, según OpenAI.

The Vergehace 3 días

AWS EC2 G7 estrena Blackwell con 4.6x mas inferencia que G6

Las nuevas instancias suman hasta 8 RTX PRO 4500 Blackwell, 256 GB de memoria GPU y 700 Gbps en EFA, y NVIDIA cuVS pasa a default en OpenSearch Serverless.

NVIDIA Bloghace 3 días

NVIDIA estrena descriptor heaps de Vulkan en sus drivers 610

VK_EXT_descriptor_heap simplifica la asignacion de recursos para ray tracing y dynamic texture indexing, y trae paridad con D3D12 a los desarrolladores graficos en NVIDIA.

NVIDIA Developerhace 3 días

NVIDIA apunta a 25% menos energía en entrenamiento con DSX y NVFP4

La compañía propone un stack completo para que las fábricas de IA optimicen tokens por watt, desde 45°C de refrigeración líquida hasta scheduling consciente de energía.

NVIDIA Developerhace 3 días

TensorRT 11.0 escala inferencia IA multi-GPU con NCCL nativo

El nuevo soporte multi-device del runtime habilita paralelismo de tensor y de contexto, y los benchmarks colocan a DeepSpeed Ulysses como la mejor estrategia para diffusion con secuencias largas.

NVIDIA Developerhace 4 días

NVIDIA Rubin recorta el consumo de agua a casi cero subiendo la temperat

El diseño de referencia para la nueva generación de data centers Rubin pasa al refrigerado 100% líquido y opera los servidores hasta a 45 grados, según el head de sustentabilidad de NVIDIA.

The Vergehace 5 días

BEVPoolV3 acelera percepción de IA física hasta 42x en GPU

NVIDIA detalla cuatro cambios algorítmicos al pooling BEV que llevan la latencia de 274 µs a 16,4 µs en RTX PRO 6000 Blackwell Max-Q gracias a FP8 y mejor uso de caché L2.

NVIDIA Developerhace 5 días

NVIDIA Agent Toolkit empaqueta Nemotron, NemoClaw y OpenShell

La pila reúne modelos abiertos, blueprints y runtime seguro en un mismo stack para que empresas construyan agentes IA especializados sin depender de terceros.

NVIDIA Bloghace 6 días

NVIDIA NemoClaw habilita agentes IA 24/7 en telcos

En el DTW Ignite 2026 en Copenhague, la compañía muestra junto a Amdocs, ServiceNow, NTT DATA y TCS un runtime seguro (OpenShell) que orquesta agentes con políticas y sandboxing para redes 5G y 6G.

NVIDIA Bloghace 6 días

NVIDIA cuPhoton acelera 14.900x imágenes del Rubin Observatory

Junto a ALCHEMI y DAQIRI, la compañía presenta en ISC Hamburgo un trío de bibliotecas CUDA-X para astronomía, simulación de materiales y adquisición de datos.

NVIDIA Bloghace 6 días

Nvidia copa el 81% del TOP500 y arrasa en el Green500

El ranking de junio del ISC en Hamburgo muestra que 9 de cada 10 sistemas nuevos del TOP500 corren sobre tecnología Nvidia, con KAIROS liderando eficiencia a 73,3 gigaflops por watt.

NVIDIA Bloghace 6 días

Electrónica

Nvidia recorta hasta 100% del agua con refrigeración a 45°C

El nuevo sistema corre con 75% agua y 25% propilenglicol entrando a 45°C, suficiente para enfriar los chips Rubin sin chillers la mayor parte del año.

Tom's Hardwarehace 6 días

NVIDIA BioNeMo duplica la eficiencia de los agentes científicos

El Agent Toolkit empaqueta OpenFold3, DiffDock, GenMol, Evo 2 y Parabricks como herramientas callable por agentes vía Model Context Protocol, sobre NIM hosted o local.

NVIDIA Developerhace 6 días

SpaceX renta GPUs por USD 28.000M, doble que Coreweave

El tercer contrato GPU de SpaceX, ahora con Reflection AI, lleva sus rentas anuales a USD 28.000 millones según Jamin Ball: doble de la facturación actual de Coreweave.

Latent Space23 jun

DFlash: hasta 15x más inferencia LLM en NVIDIA Blackwell

El método de speculative decoding por bloques desplaza a EAGLE-3 y libera 20 checkpoints abiertos en Hugging Face para Hopper y Blackwell.

NVIDIA Developer23 jun

NVIDIA DAQIRI canaliza datos de sensores directo a la GPU sin kernel

La librería del Holoscan Platform usa DPDK y GPUDirect para canalizar streams de cientos de Gbps al tensor en GPU sin copias intermedias, con caso de uso en el HL-LHC del CERN.

NVIDIA Developer23 jun

NVIDIA Halos lleva la seguridad funcional de los autos a los robots

El stack combina IGX Thor con un sistema operativo certificable IEC 61508 SIL 3 y promete acortar la certificación de humanoides y AMR con Agility y Boston Dynamics como primeros usuarios.

NVIDIA Developer23 jun

Groq levanta USD 650M tras el not-acqui-hire de NVIDIA

Seis meses después de licenciar su IP de LPU a NVIDIA y perder a su fundador, la chipmaker apuesta por su negocio neocloud con 13 data centers y nuevos ejecutivos al timón.

TechCrunch AI23 jun

JUPITER en ISC: cerebro, clima y simulación cuántica de 50 qubits

El primer exascale europeo, en Forschungszentrum Jülich, mostró cuatro hitos: foundation model del cerebro, clima global a 1 km, IA para 6G y récord en simulación cuántica.

NVIDIA Blog23 jun

NVIDIA Rubin enfría con líquido a 45°C y sin ventiladores

La nueva generación de infraestructura de IA es la primera 100% refrigerada por líquido, opera con coolant a 45°C y puede reducir el consumo de agua del centro de datos a casi cero.

NVIDIA Blog23 jun

NVIDIA Vera CPU abre la era de IA agéntica científica en Los Alamos

Los nuevos supercomputadores Mission, Vision y Veritas combinarán Vera Rubin con HPE Cray GX5000 para potenciar agentes científicos como URSA y descargar trabajo desde Crossroads.

NVIDIA Blog23 jun

CCCL Runtime: NVIDIA propone una capa C++ moderna para CUDA

Headers como cuda/stream, cuda/buffer y cuda/launch ofrecen tipos fuertes, dependencias explícitas y APIs asíncronas por defecto, sin reescribir el código que usa CUDA Runtime.

NVIDIA Developer23 jun

Electrónica

Servidores Arm superan 45% del mercado data center y empujan a x86

Los datos de IDC del primer trimestre 2026 muestran ingresos récord de USD 122.600 millones; las máquinas aceleradas con GPU, ASIC y FPGA generan más del 70% de la facturación global.

Tom's Hardware23 jun

Robótica

NVIDIA Halos: stack completo de seguridad para robots industriales

Adoptado por Agility Robotics para sus humanoides Digit en Amazon, GXO y Toyota; combina IGX Thor, Halos Core y un laboratorio acreditado por ANAB.

The Robot Report23 jun

Electrónica

NVIDIA Vera vs Ampere Altra Max: benchmarks ARM en Linux

Phoronix midió la CPU Olympus de 88 núcleos frente al SoC Altra Max de 128 Neoverse-N1, en igual stack Ubuntu 24.04 LTS sobre System76 Thelio Astra.

Phoronix Tests22 jun

Electrónica

Tesla Megapod: hardware modular para datacenters de IA

La marca registra el nombre menos de un año después del cierre de Dojo y apunta a un mercado dominado por Nvidia y su sistema NVL72.

Electrek22 jun

Electrónica

DLSS llega al driver open source NVK para Nvidia en Linux

El parche aterriza en Mesa 26.2-devel detrás de la bandera NVK_EXPERIMENTAL=dlss y carga los binarios CUDA precompilados de Nvidia en lugar de reimplementar el upscaler.

Tom's Hardware21 jun

AWS evalua vender Trainium para disputarle USD 50B a Nvidia

Peter DeSantis confirmo a Bloomberg que Amazon negocia vender sus chips Trainium a otros datacenters, un mercado que Andy Jassy estimo en USD 50.000 millones anuales si AWS dejara de consumirlo todo.

TechCrunch AI21 jun

Electrónica

NVIDIA ENPIRE: robots aprenden solos a instalar GPUs

El framework entrega una flota de robots y un presupuesto de tokens a 8 agentes Codex para que descubran solos cómo alinear conectores PCIe, ordenar pines metálicos y cortar zip ties.

Tom's Hardware18 jun

HPE AI Factory con NVIDIA suma Vera CPU y Agent Toolkit

En HPE Discover Las Vegas, NVIDIA y HPE anuncian la CPU Vera para los ProLiant DL394 Gen12 en 2027, el Agent Toolkit con Nemotron y NemoClaw, y Confidential Computing en todo el portafolio.

NVIDIA Blog18 jun

NVIDIA XR AI: librería abierta para agentes en gafas AR

El stack llega en beta pública con Cosmos para visión, Nemotron para lenguaje, MCP para datos empresariales y NeMo Agent Toolkit para orquestación, todo bajo licencia abierta en GitHub.

NVIDIA Developer18 jun

Electrónica

SMI alinea su SSD PCIe 6.0 con NVIDIA, no con Intel ni AMD

Silicon Motion apunta a fines de 2027 para su plataforma cliente de PCIe Gen6, empujada por la hambre de ancho de banda de los chips RTX Spark y GB10.

Tom's Hardware18 jun

ENPIRE: NVIDIA hace que ocho robots se entrenen solos al 99% con agentes

El proyecto con Carnegie Mellon y UC Berkeley pone a Codex, Claude Code y Kimi Code a escribir el código de entrenamiento, leer papers y coordinar una flota completa por Git.

The Decoder18 jun

NVIDIA libera ACE Game Agent SDK para NPCs en Unreal Engine 5

El framework abierto en C/C++ permite construir companions on-device con ASR, SLM y TTS, ya probado en PUBG: BATTLEGROUNDS y Total War: PHARAOH sobre hardware GeForce RTX.

NVIDIA Developer17 jun

NVIDIA Blackwell domina MLPerf Training 6.0 con 8.192 GPUs

Fue la única plataforma en presentar resultados sobre cada test, incluyendo DeepSeek-V3 (671B parámetros) y GPT-OSS-20B, y escaló a 8.192 GPUs Blackwell Ultra en datacenters de producción.

NVIDIA Developer17 jun

NVIDIA libera receta para entrenar tu propio modelo de transacciones

El workflow Build Your Own Transaction Model combina cuDF, cuML y NeMo AutoModel para llegar a un Llama de 29M parámetros que mejora 50% la precisión sobre XGBoost en detección de fraude.

NVIDIA Developer17 jun

FP8 y NVFP4 en Transformers: hasta 3,48x con Blackwell B300

NVIDIA muestra cómo medir GEMM por GEMM la ganancia real de las precisiones bajas en CodonFM 5B, separando el costo de cuantización del rendimiento puro del kernel.

NVIDIA Developer17 jun

Blackwell barre MLPerf Training 6.0: NVIDIA escala a 8.192 GPU

GB200 NVL72 y GB300 NVL72 lideran las siete pruebas del benchmark, incluyendo las nuevas cargas MoE DeepSeek-V3 671B y GPT-OSS-20B, con CoreWeave entrenando en 2,02 minutos.

NVIDIA Blog17 jun

NVIDIA acelera el entrenamiento MoE hasta 93% con kernels CuTe DSL

Los kernels fusionados eliminan cuellos de botella de memoria y sincronización CPU-GPU, entregan speedup de 1,3× a 2× por kernel y mejoran 93% el pre-entrenamiento de GPT-OSS.

NVIDIA Developer16 jun

NVIDIA BioNeMo Recipes: LoRA entrena modelos biológicos en una sola GPU

El framework abierto de NVIDIA permite afinar ESM2-3B (proteínas) y Evo2-1B (ADN) entrenando apenas 1% de los parámetros y obteniendo precisión equivalente al fine-tuning completo.

NVIDIA Developer16 jun

World-Action Models: la nueva ola IA para robótica generalista

Investigadores de NVIDIA mapean cómo los video-backbones (Cosmos Policy, DreamZero) compiten con la receta VLM-VLA dominante en GR00T y Pi-0 para entrenar policies generalistas en humanoides y cobots.

NVIDIA Developer15 jun

Electrónica

Microsoft prueba Copilot+ con GPUs discretas en vez de NPUs

Un SDK experimental de Windows ya permite correr Language Model APIs sobre tarjetas Nvidia RTX 30-series con al menos 6 GB de VRAM, abriendo la IA local a desktops sin chip dedicado.

Tom's Hardware14 jun

Electrónica

NVIDIA venderá CPUs Vera a China desde agosto pese al freno de las GPUs

Mientras los envíos de H200 siguen frenados, NVIDIA invita a clientes chinos a tomar pedidos de Vera con shipping en agosto. Más de 300 servidores Vera ya están en pruebas.

Tom's Hardware14 jun

Electrónica

NVIDIA SCADA: Wiwynn arma servidor de 2,9 PB y 528M IOPS

El primer servidor SCaled Accelerated Data Access para IA empaca 96 SSDs PCIe 6.0 Micron 9650 Pro, CPU NVIDIA Vera y cuatro RTX Pro 6000 Blackwell en 6U.

Tom's Hardware14 jun

NVIDIA GB300 NVL72 rinde 20x más agentes que H200 en AA-AgentPerf

Artificial Analysis estrenó el primer benchmark multi-vendor que mide rendimiento concurrente de agentes de IA en cargas reales de coding, con resultados normalizados por acelerador y por megawatt.

NVIDIA Developer14 jun

Electrónica

Nebius y NVIDIA abren un Living Lab de IA física en Londres

Programa de seis meses para startups británicas y europeas de robótica que combina la nube AI de Nebius con la pila completa de NVIDIA, incluyendo Cosmos, Isaac y GPUs RTX PRO.

Electronics Weekly13 jun

NVIDIA Blackwell lidera el primer benchmark de IA agéntica

El GB300 NVL72 corre 20× más agentes por megawatt que el HGX H200 en AgentPerf, el primer benchmark de Artificial Analysis que mide cargas reales de agentes encadenando llamadas LLM.

NVIDIA Blog13 jun

MiniMax M3: MoE de 428B con 1M de contexto en Blackwell

Sirve contextos de 1 millón de tokens con costo por token 20 veces menor que M2, y se despliega en NVIDIA Dynamo, TensorRT-LLM, SGLang y vLLM con pesos abiertos en Hugging Face.

NVIDIA Developer13 jun

Electrónica

Taiwán evalúa criminalizar exportaciones de chips de IA a China

El gobierno de Taipei discute extender las restricciones más allá de las firmas en lista negra y enjuiciar el contrabando como delito penal por primera vez, según Bloomberg.

Tom's Hardware12 jun

Electrónica

SpaceX detalla AI1: datacenter orbital de 150 kW a 3 días del IPO

El satélite con envergadura de 70 metros (mayor que la de un Boeing 747-8) aloja un payload de compute equivalente a un rack Nvidia GB300, orbita a 600 km y deja elegir el chipmaker.

Tom's Hardware12 jun

DiffusionGemma de Google escribe texto desde ruido a 1.000 tokens/s

El modelo experimental de pesos abiertos genera 256 tokens en paralelo y supera a Gemma 4 en velocidad, aunque pierde calidad en los benchmarks de Google.

The Decoder12 jun

Robótica

Por qué la robótica no tendrá un momento Llama tan limpio

Las políticas robóticas se pueden descargar como pesos, pero recién valen algo cuando el controlador, la celda física y los datos de falla las convierten en trabajo repetible sobre el robot instalado.

The Robot Report12 jun

Electrónica

AMD dice que Zen 6 Venice de 256 cores supera 3,3 veces a Nvidia Vera

Los primeros benchmarks estimados del EPYC Venice apuntan a una superioridad a escala de rack con presupuesto de 100kW. El catch: AMD no testeó Vera, son modelos basados en datos de Phoronix.

Tom's Hardware11 jun

Robótica

Centros de datos en órbita: el desafío térmico real

La idea de llevar la computación a la órbita terrestre enfrenta barreras físicas infranqueables. La radiación y la falta de atmósfera complican la gestión térmica.

IEEE Spectrum11 jun

DiffusionGemma: IA de alto rendimiento en hardware NVIDIA

Google DeepMind y NVIDIA optimizan la generación de texto paralela, logrando mayor throughput y menores costos operativos para aplicaciones empresariales de IA.

NVIDIA Developer11 jun

Open Source

Lemonade 10.7 de AMD suma soporte CUDA para GPU NVIDIA

El servidor local de IA open source de AMD ahora detecta GPU NVIDIA en Windows y Linux vía Llama.cpp y stable-diffusion.cpp, y agrega benchmarks comparables entre runtimes.

Phoronix Tests11 jun

DiffusionGemma: generación de texto 4 veces más rápida

Google DeepMind publica un modelo experimental MoE de 26B parámetros bajo Apache 2.0 que genera bloques de 256 tokens en paralelo, alcanzando 1.000 tok/s en una NVIDIA H100.

Google DeepMind11 jun

Open Source

GCC: parche de NVIDIA acelera el bootstrap en un 43%

El ingeniero Kyrylo Tkachov presentó una mejora para el compilador GNU que reduce drásticamente los tiempos de compilación nativa en entornos AArch64.

Phoronix Tests10 jun

Etiquetas relacionadas

Otros temas que aparecen junto a #nvidia en nuestra cobertura editorial.

#Agentes IA39 #Open Source36 #Robotica20 #LLM17 #Blackwell15 #gpu13 #cuda12 #ai-infrastructure10