
SGLang sirve DeepSeek-V4 en GB300 con 5x más throughput
Dos meses después del lanzamiento, el stack abierto pasó de 2.200 a 11.200 tok/s/GPU a la misma interactividad gracias a KV Compression V2, W4A4 MegaMoE y CUDA graphs rompibles en el prefill.
18 notas publicadas

El SoC chino combina cuatro C920 a 2,3 GHz, cuatro C908 a 1,9 GHz y un acelerador IA que corre DeepSeek-7B a 8 tokens por segundo; el dev kit A210 SODIMM V2 se vende en AliExpress por USD 334,33.

Fue la única plataforma en presentar resultados sobre cada test, incluyendo DeepSeek-V3 (671B parámetros) y GPT-OSS-20B, y escaló a 8.192 GPUs Blackwell Ultra en datacenters de producción.

Nathan Lambert y Finbarr Timbers repasan en Interconnects cómo MiMo Flash v2, DeepSeek V4 y Nemotron 3 Ultra adoptaron destilación on-policy con múltiples profesores en lugar de un único RL gigante.

El ex jefe de ecosistema Asia-Pacífico de Hugging Face habló con Rest of World sobre destilación, monetización y por qué los modelos abiertos chinos están corriendo en hardware estadounidense.

Los kernels fusionados eliminan cuellos de botella de memoria y sincronización CPU-GPU, entregan speedup de 1,3× a 2× por kernel y mejoran 93% el pre-entrenamiento de GPT-OSS.

Las suscripciones de Anthropic y OpenAI quedan en rojo si el usuario las exprime, mientras firmas como Lindy reportan ahorros de millones cambiando Sonnet por DeepSeek V4 sin perder calidad.

El GB300 NVL72 corre 20× más agentes por megawatt que el HGX H200 en AgentPerf, el primer benchmark de Artificial Analysis que mide cargas reales de agentes encadenando llamadas LLM.

La IA china escala posiciones en el mercado corporativo estadounidense gracias a una agresiva estrategia de precios que desafía a los gigantes de Silicon Valley.

El fundador Liang Wenfeng le dijo a inversionistas que la ronda de 13.200 millones de dolares apunta a AGI y modelos open source, no a monetizar rapido.

El recorte sobre DeepSeek V4 Pro lleva el output a USD 0,87 por millon de tokens y consolida la guerra de precios que la oferta china abrio contra OpenAI y Anthropic.

Un giro narrativo de Greg Brockman, el cierre del equipo de modelos de AI21 y el primer equipo de harness en DeepSeek apuntan al mismo movimiento: el modelo dejó de ser el producto.

La china Deepseek monta un equipo "Harness" en Beijing para construir su propio agente de programación, en competencia directa con los productos de Anthropic, OpenAI y Cursor.

El último boletín de Interconnects repasa los lanzamientos del mes en pesos abiertos y discute por qué los benchmarks del CAISI muestran una brecha más grande que la real.

El paper presentado durante la visita de Trump a Beijing plantea dos escenarios para 2028: ventaja democrática sostenida o paridad con regímenes autoritarios.

Una investigación de Oxford China Policy Lab documenta 'transfer stations' que operan en GitHub, Taobao y Telegram con credenciales robadas, sustitución de modelos y cosecha de prompts.

Huawei proyecta USD 12.000 millones en chips IA en 2026 (60% más que en 2025) mientras los envíos del H200 de Nvidia siguen frenados por la disputa regulatoria entre Washington y Beijing.

Los modelos V4-Pro y V4-Flash de pesos abiertos logran ventanas de contexto de un millón de tokens con una drástica reducción en el costo de cómputo.
Otros temas que aparecen junto a #deepseek en nuestra cobertura editorial.