Etiqueta

#deepseek

18 notas publicadas

SGLang sirve DeepSeek-V4 en GB300 con 5x más throughput

Dos meses después del lanzamiento, el stack abierto pasó de 2.200 a 11.200 tok/s/GPU a la misma interactividad gracias a KV Compression V2, W4A4 MegaMoE y CUDA graphs rompibles en el prefill.

PyTorch Bloghace 3 días

Electrónica

Zhihe A210: SoC RISC-V de 8 núcleos con NPU 12 TOPS para SBC modular

El SoC chino combina cuatro C920 a 2,3 GHz, cuatro C908 a 1,9 GHz y un acelerador IA que corre DeepSeek-7B a 8 tokens por segundo; el dev kit A210 SODIMM V2 se vende en AliExpress por USD 334,33.

CNX Software18 jun

NVIDIA Blackwell domina MLPerf Training 6.0 con 8.192 GPUs

Fue la única plataforma en presentar resultados sobre cada test, incluyendo DeepSeek-V3 (671B parámetros) y GPT-OSS-20B, y escaló a 8.192 GPUs Blackwell Ultra en datacenters de producción.

NVIDIA Developer17 jun

Post-training de frontera 2026: MOPD reemplaza al RL monolítico

Nathan Lambert y Finbarr Timbers repasan en Interconnects cómo MiMo Flash v2, DeepSeek V4 y Nemotron 3 Ultra adoptaron destilación on-policy con múltiples profesores en lugar de un único RL gigante.

Interconnects17 jun

Tiezhen Wang: por qué el open source chino le gana a OpenAI

El ex jefe de ecosistema Asia-Pacífico de Hugging Face habló con Rest of World sobre destilación, monetización y por qué los modelos abiertos chinos están corriendo en hardware estadounidense.

Rest of World17 jun

NVIDIA acelera el entrenamiento MoE hasta 93% con kernels CuTe DSL

Los kernels fusionados eliminan cuellos de botella de memoria y sincronización CPU-GPU, entregan speedup de 1,3× a 2× por kernel y mejoran 93% el pre-entrenamiento de GPT-OSS.

NVIDIA Developer16 jun

Electrónica

Costos de IA disparan a empresas hacia DeepSeek V4 y modelos open-source

Las suscripciones de Anthropic y OpenAI quedan en rojo si el usuario las exprime, mientras firmas como Lindy reportan ahorros de millones cambiando Sonnet por DeepSeek V4 sin perder calidad.

Tom's Hardware14 jun

NVIDIA Blackwell lidera el primer benchmark de IA agéntica

El GB300 NVL72 corre 20× más agentes por megawatt que el HGX H200 en AgentPerf, el primer benchmark de Artificial Analysis que mide cargas reales de agentes encadenando llamadas LLM.

NVIDIA Blog13 jun

DeepSeek gana terreno en empresas de EE. UU. por sus bajos costos

La IA china escala posiciones en el mercado corporativo estadounidense gracias a una agresiva estrategia de precios que desafía a los gigantes de Silicon Valley.

Xataka6 jun

Deepseek prioriza investigacion AGI sobre ganancias rapidas

El fundador Liang Wenfeng le dijo a inversionistas que la ronda de 13.200 millones de dolares apunta a AGI y modelos open source, no a monetizar rapido.

The Decoder24 may

DeepSeek deja permanente el 75% de descuento: hasta 51x mas barato

El recorte sobre DeepSeek V4 Pro lleva el output a USD 0,87 por millon de tokens y consolida la guerra de precios que la oferta china abrio contra OpenAI y Anthropic.

The Decoder24 may

Los laboratorios de modelos se transforman en laboratorios de agentes IA

Un giro narrativo de Greg Brockman, el cierre del equipo de modelos de AI21 y el primer equipo de harness en DeepSeek apuntan al mismo movimiento: el modelo dejó de ser el producto.

Latent Space24 may

Deepseek arma equipo en Beijing para competir con Claude Code y Codex

La china Deepseek monta un equipo "Harness" en Beijing para construir su propio agente de programación, en competencia directa con los productos de Anthropic, OpenAI y Cursor.

The Decoder21 may

Bonanza open: Gemma 4, DeepSeek V4, Kimi K2.6 y MiMo 2.5 estrenan

El último boletín de Interconnects repasa los lanzamientos del mes en pesos abiertos y discute por qué los benchmarks del CAISI muestran una brecha más grande que la real.

Interconnects17 may

Anthropic urge a EE.UU. a blindar su ventaja en chips ante China

El paper presentado durante la visita de Trump a Beijing plantea dos escenarios para 2028: ventaja democrática sostenida o paridad con regímenes autoritarios.

The Decoder16 may

Electrónica

Mercado gris chino revende Claude al 10% del precio oficial

Una investigación de Oxford China Policy Lab documenta 'transfer stations' que operan en GitHub, Taobao y Telegram con credenciales robadas, sustitución de modelos y cosecha de prompts.

Tom's Hardware11 may

Electrónica

Huawei apunta a destronar a Nvidia en chips de IA en China

Huawei proyecta USD 12.000 millones en chips IA en 2026 (60% más que en 2025) mientras los envíos del H200 de Nvidia siguen frenados por la disputa regulatoria entre Washington y Beijing.

Tom's Hardware5 may

Deepseek lanza V4-Pro: modelo IA casi gratis que desafía a OpenAI

Los modelos V4-Pro y V4-Flash de pesos abiertos logran ventanas de contexto de un millón de tokens con una drástica reducción en el costo de cómputo.

The Decoder26 abr

Etiquetas relacionadas

Otros temas que aparecen junto a #deepseek en nuestra cobertura editorial.

#Agentes IA6 #LLM5 #Nvidia5 #Anthropic5 #Open Source5 #china4 #Openai4 #inferencia2