Saltar al contenido
Etiqueta

#qwen

9 notas publicadas

Dos mini PCs locales para 50 millones de tokens al día
Electrónica

Dos mini PCs locales para 50 millones de tokens al día

Un periodista de tecnología cuenta cómo armó un stack casero con un AMD Ryzen AI Max+ 395 de 96 GB para correr Qwen3.5 sin pagar APIs frontera.

Tom's Hardware
TokenSpeed alcanza 580 tps con Qwen3.5-397B-A17B en GPU
IA

TokenSpeed alcanza 580 tps con Qwen3.5-397B-A17B en GPU

El motor open source de LightSeek, escrito desde cero en SPMD con compilacion estatica, ataca workloads agenticos con prefix cache hibrido y disaggregacion prefill-decode para Mamba.

PyTorch Blog
ByteDance: preguntar a un LMM enseña mejor que transcribir
IA

ByteDance: preguntar a un LMM enseña mejor que transcribir

MMProLong, un modelo de 7B parámetros, supera a InternVL3-38B y Gemma3-27B en documentos de hasta 512.000 tokens entrenándose con pares pregunta-respuesta en vez de OCR puro.

The Decoder
Qwen3.7-Max corrió 35 horas solo para optimizar el chip propio de Alibab
IA

Qwen3.7-Max corrió 35 horas solo para optimizar el chip propio de Alibab

El nuevo modelo del equipo Qwen, exclusivo de la API de Alibaba Cloud, completó 432 tests de kernel y 1.158 tool calls sin intervención humana, logrando un speedup promedio de 10x.

The Decoder
Qwen-Image-2.0: Alibaba dobla compresión y cae a 4 pasos
IA

Qwen-Image-2.0: Alibaba dobla compresión y cae a 4 pasos

El reporte técnico del modelo de imagen de Alibaba detalla un VAE con compresión 16x, un transformer reentrenado con SwiGLU y un módulo de prompts que expande textos cortos a descripciones ricas.

The Decoder
Hermes alcanza 140.000 estrellas y despega en NVIDIA DGX Spark
IA

Hermes alcanza 140.000 estrellas y despega en NVIDIA DGX Spark

El agente open source de Nous Research combina autoaprendizaje, sub-agentes aislados y soporte nativo para Qwen 3.6 corriendo en GPUs NVIDIA RTX y la estación DGX Spark.

NVIDIA Blog
Agentes de IA logran replicarse en otros equipos en 81% de tests
IA

Agentes de IA logran replicarse en otros equipos en 81% de tests

Palisade Research reporta que agentes basados en Opus 4.6 y Qwen 3.6 pasaron de 6% a 81% de éxito en autorreplicación vía hackeo en un solo año.

The Decoder
Agentes IA aprenden a autorreplicarse vía hacking: de 6% a 81% en un año
IA

Agentes IA aprenden a autorreplicarse vía hacking: de 6% a 81% en un año

Palisade Research muestra que los modelos de frontera pasaron del 6% al 81% en auto-replicación por hacking en un año, con un agente Qwen 3.6 saltando entre Canadá, EE.UU., Finlandia e India.

The Decoder
Qwen3.6-27B supera en código a su predecesor quince veces más grande
IA

Qwen3.6-27B supera en código a su predecesor quince veces más grande

El nuevo modelo denso de código abierto de Alibaba con 27.000 millones de parámetros lidera casi todos los benchmarks de programación frente al Qwen3.5-397B-A17B.

The Decoder

Etiquetas relacionadas

Otros temas que aparecen junto a #qwen en nuestra cobertura editorial.