Saltar al contenido
Etiqueta

#deepseek

18 notas publicadas

SGLang sirve DeepSeek-V4 en GB300 con 5x más throughput
IA

SGLang sirve DeepSeek-V4 en GB300 con 5x más throughput

Dos meses después del lanzamiento, el stack abierto pasó de 2.200 a 11.200 tok/s/GPU a la misma interactividad gracias a KV Compression V2, W4A4 MegaMoE y CUDA graphs rompibles en el prefill.

PyTorch Blog
Zhihe A210: SoC RISC-V de 8 núcleos con NPU 12 TOPS para SBC modular
Electrónica

Zhihe A210: SoC RISC-V de 8 núcleos con NPU 12 TOPS para SBC modular

El SoC chino combina cuatro C920 a 2,3 GHz, cuatro C908 a 1,9 GHz y un acelerador IA que corre DeepSeek-7B a 8 tokens por segundo; el dev kit A210 SODIMM V2 se vende en AliExpress por USD 334,33.

CNX Software
NVIDIA Blackwell domina MLPerf Training 6.0 con 8.192 GPUs
IA

NVIDIA Blackwell domina MLPerf Training 6.0 con 8.192 GPUs

Fue la única plataforma en presentar resultados sobre cada test, incluyendo DeepSeek-V3 (671B parámetros) y GPT-OSS-20B, y escaló a 8.192 GPUs Blackwell Ultra en datacenters de producción.

NVIDIA Developer
Post-training de frontera 2026: MOPD reemplaza al RL monolítico
IA

Post-training de frontera 2026: MOPD reemplaza al RL monolítico

Nathan Lambert y Finbarr Timbers repasan en Interconnects cómo MiMo Flash v2, DeepSeek V4 y Nemotron 3 Ultra adoptaron destilación on-policy con múltiples profesores en lugar de un único RL gigante.

Interconnects
Tiezhen Wang: por qué el open source chino le gana a OpenAI
IA

Tiezhen Wang: por qué el open source chino le gana a OpenAI

El ex jefe de ecosistema Asia-Pacífico de Hugging Face habló con Rest of World sobre destilación, monetización y por qué los modelos abiertos chinos están corriendo en hardware estadounidense.

Rest of World
NVIDIA acelera el entrenamiento MoE hasta 93% con kernels CuTe DSL
IA

NVIDIA acelera el entrenamiento MoE hasta 93% con kernels CuTe DSL

Los kernels fusionados eliminan cuellos de botella de memoria y sincronización CPU-GPU, entregan speedup de 1,3× a 2× por kernel y mejoran 93% el pre-entrenamiento de GPT-OSS.

NVIDIA Developer
Costos de IA disparan a empresas hacia DeepSeek V4 y modelos open-source
Electrónica

Costos de IA disparan a empresas hacia DeepSeek V4 y modelos open-source

Las suscripciones de Anthropic y OpenAI quedan en rojo si el usuario las exprime, mientras firmas como Lindy reportan ahorros de millones cambiando Sonnet por DeepSeek V4 sin perder calidad.

Tom's Hardware
NVIDIA Blackwell lidera el primer benchmark de IA agéntica
IA

NVIDIA Blackwell lidera el primer benchmark de IA agéntica

El GB300 NVL72 corre 20× más agentes por megawatt que el HGX H200 en AgentPerf, el primer benchmark de Artificial Analysis que mide cargas reales de agentes encadenando llamadas LLM.

NVIDIA Blog
DeepSeek gana terreno en empresas de EE. UU. por sus bajos costos
IA

DeepSeek gana terreno en empresas de EE. UU. por sus bajos costos

La IA china escala posiciones en el mercado corporativo estadounidense gracias a una agresiva estrategia de precios que desafía a los gigantes de Silicon Valley.

Xataka
Deepseek prioriza investigacion AGI sobre ganancias rapidas
IA

Deepseek prioriza investigacion AGI sobre ganancias rapidas

El fundador Liang Wenfeng le dijo a inversionistas que la ronda de 13.200 millones de dolares apunta a AGI y modelos open source, no a monetizar rapido.

The Decoder
DeepSeek deja permanente el 75% de descuento: hasta 51x mas barato
IA

DeepSeek deja permanente el 75% de descuento: hasta 51x mas barato

El recorte sobre DeepSeek V4 Pro lleva el output a USD 0,87 por millon de tokens y consolida la guerra de precios que la oferta china abrio contra OpenAI y Anthropic.

The Decoder
Los laboratorios de modelos se transforman en laboratorios de agentes IA
IA

Los laboratorios de modelos se transforman en laboratorios de agentes IA

Un giro narrativo de Greg Brockman, el cierre del equipo de modelos de AI21 y el primer equipo de harness en DeepSeek apuntan al mismo movimiento: el modelo dejó de ser el producto.

Latent Space
Deepseek arma equipo en Beijing para competir con Claude Code y Codex
IA

Deepseek arma equipo en Beijing para competir con Claude Code y Codex

La china Deepseek monta un equipo "Harness" en Beijing para construir su propio agente de programación, en competencia directa con los productos de Anthropic, OpenAI y Cursor.

The Decoder
Bonanza open: Gemma 4, DeepSeek V4, Kimi K2.6 y MiMo 2.5 estrenan
IA

Bonanza open: Gemma 4, DeepSeek V4, Kimi K2.6 y MiMo 2.5 estrenan

El último boletín de Interconnects repasa los lanzamientos del mes en pesos abiertos y discute por qué los benchmarks del CAISI muestran una brecha más grande que la real.

Interconnects
Anthropic urge a EE.UU. a blindar su ventaja en chips ante China
IA

Anthropic urge a EE.UU. a blindar su ventaja en chips ante China

El paper presentado durante la visita de Trump a Beijing plantea dos escenarios para 2028: ventaja democrática sostenida o paridad con regímenes autoritarios.

The Decoder
Mercado gris chino revende Claude al 10% del precio oficial
Electrónica

Mercado gris chino revende Claude al 10% del precio oficial

Una investigación de Oxford China Policy Lab documenta 'transfer stations' que operan en GitHub, Taobao y Telegram con credenciales robadas, sustitución de modelos y cosecha de prompts.

Tom's Hardware
Huawei apunta a destronar a Nvidia en chips de IA en China
Electrónica

Huawei apunta a destronar a Nvidia en chips de IA en China

Huawei proyecta USD 12.000 millones en chips IA en 2026 (60% más que en 2025) mientras los envíos del H200 de Nvidia siguen frenados por la disputa regulatoria entre Washington y Beijing.

Tom's Hardware
Deepseek lanza V4-Pro: modelo IA casi gratis que desafía a OpenAI
IA

Deepseek lanza V4-Pro: modelo IA casi gratis que desafía a OpenAI

Los modelos V4-Pro y V4-Flash de pesos abiertos logran ventanas de contexto de un millón de tokens con una drástica reducción en el costo de cómputo.

The Decoder

Etiquetas relacionadas

Otros temas que aparecen junto a #deepseek en nuestra cobertura editorial.