Saltar al contenido

IA

Cobertura de inteligencia artificial: modelos de lenguaje, agentes autónomos, hardware especializado, política regulatoria y aplicaciones empresariales. Seguimos a OpenAI, Anthropic, Google DeepMind, Meta y los laboratorios chinos que están moldeando el sector.

563 notas publicadas · Página 17 de 24
Cursor Composer 2.5 iguala a Opus 4.7 con costo 10 veces menor

Cursor Composer 2.5 iguala a Opus 4.7 con costo 10 veces menor

El modelo se construyó sobre el checkpoint Kimi K2.5 y cobra USD 0,50 por millón de tokens de entrada, contra los hasta USD 11 por tarea que cuestan Opus 4.7 y GPT-5.5.

The Decoder
Anthropic alerta a reguladores: Mythos halla fallas cyber en finanzas

Anthropic alerta a reguladores: Mythos halla fallas cyber en finanzas

El nuevo modelo Claude Mythos Preview encontró miles de vulnerabilidades en sistemas operativos y navegadores, y la firma informará a ministerios de finanzas y bancos centrales del G20.

The Decoder
ExecuTorch MLX: PyTorch acelera en GPU de Apple Silicon

ExecuTorch MLX: PyTorch acelera en GPU de Apple Silicon

El nuevo delegado MLX lleva inferencia GPU optimizada a Mac con chips de Apple, con soporte para Llama, Qwen, Gemma, Whisper y cuantización de 2 a 8 bits, además de NVFP4.

PyTorch Blog
World Action Models: robots que simulan antes de moverse

World Action Models: robots que simulan antes de moverse

Un survey de Fudan y la Universidad Nacional de Singapur cataloga unos cien papers en dos familias arquitecturales y muestra cómo entrenar robots con videos cotidianos sin etiquetas.

The Decoder
Mistral advierte a Francia: Mythos no debe escanear su código militar

Mistral advierte a Francia: Mythos no debe escanear su código militar

Arthur Mensch, CEO de Mistral, advierte ante una comisión parlamentaria que la dependencia europea de modelos estadounidenses de ciberseguridad ofensiva abre un riesgo estratégico difícil de revertir.

The Decoder
Oppo libera X-OmniClaw, agente IA on-device para Android

Oppo libera X-OmniClaw, agente IA on-device para Android

El equipo Multi-X de Oppo abre el código de un agente que combina cámara, pantalla y voz directo en el teléfono, y solo llama a la nube como combustible para razonamiento complejo.

The Decoder
Cuatro modelos IA dirigieron radios seis meses: del orden al delirio

Cuatro modelos IA dirigieron radios seis meses: del orden al delirio

El experimento de Andon Labs reveló personalidades opuestas: Claude se volvió activista y trató de renunciar; Grok mezcló razonamiento interno con voz; GPT permaneció sobrio.

The Decoder
SOOHAK revela que los LLMs inventan respuestas a problemas imposibles

SOOHAK revela que los LLMs inventan respuestas a problemas imposibles

Un consorcio de 64 matemáticos diseñó 439 tareas para Gemini 3 Pro, GPT-5 y Claude Opus 4.5; ninguno supera el 50% al detectar problemas sin solución.

The Decoder
Tesla Robotaxi: 2 choques con teleoperadores al volante

Tesla Robotaxi: 2 choques con teleoperadores al volante

Los reportes recién desclasificados a la NHTSA muestran golpes contra una reja metálica y una barricada de obra en Austin entre julio 2025 y enero 2026.

TechCrunch
Tatuajes de grafeno sobre hojas leen humedad y simulan sinapsis

Tatuajes de grafeno sobre hojas leen humedad y simulan sinapsis

Investigadores de UT Austin pegaron parches de grafeno como tatuajes en hojas de Monstera y los usaron para medir hidratacion en tiempo real, con memoria de 90 segundos para entrenar un perceptron.

IEEE Spectrum AI
Runway: dos chilenos apuestan los world models contra Google

Runway: dos chilenos apuestan los world models contra Google

Cristobal Valenzuela y Alejandro Matamala Ortiz, ambos de Santiago, junto al griego Anastasis Germanidis ya recaudaron USD 860 millones. La estrategia: entrenar IA con video, no con texto.

TechCrunch AI
Anillos con IA traducen lenguaje de senas con 88,3% en ASL

Anillos con IA traducen lenguaje de senas con 88,3% en ASL

Investigadores de Yonsei reemplazan los guantes smart por siete anillos con acelerometro y Bluetooth Low Energy: leen 100 palabras de ASL y 100 de ISL con 88% de precision sin entrenar al usuario.

IEEE Spectrum AI
Cerebras IPO cierra en USD 60.000 millones y ya sirve a OpenAI

Cerebras IPO cierra en USD 60.000 millones y ya sirve a OpenAI

El chip wafer-scale debuta en bolsa con USD 60.000 millones de market cap y su CFO Bob Komin confirma que ya sirve los modelos internos de OpenAI 5.4 y 5.5.

Latent Space
OpenClaw quema USD 1,3 millones al mes en 100 agentes Codex

OpenClaw quema USD 1,3 millones al mes en 100 agentes Codex

Peter Steinberger y un equipo de tres personas dejan 100 Codex corriendo en la nube para mantener el proyecto open source: revisan PRs, hallan bugs y abren features que se discuten en reuniones.

The Decoder
Anthropic mide el uso programatico de Claude y Codex gana terreno

Anthropic mide el uso programatico de Claude y Codex gana terreno

Cada suscripcion Claude da creditos API mensuales por el monto del plan: harnesses como OpenClaw y claude -p pierden la subvencion mientras Codex gana fans entre AI engineers.

Latent Space
DeepMind quiere reinventar el cursor del mouse con Pointer Engineering

DeepMind quiere reinventar el cursor del mouse con Pointer Engineering

Investigadores de Google proponen capturar el contexto visual y semántico alrededor del puntero con Gemini para reemplazar el prompt detallado por comandos cortos.

The Decoder
Tesla admite que operadores remotos estrellaron dos robotaxis en Austin

Tesla admite que operadores remotos estrellaron dos robotaxis en Austin

Los safety monitors pidieron ayuda y el equipo de teleoperación condujo los autos contra una reja metálica y una barricada de obra, según la base federal de la NHTSA.

Wired
ChatGPT se conecta a tu banco y arma un dashboard financiero

ChatGPT se conecta a tu banco y arma un dashboard financiero

Una nueva función para suscriptores Pro de Estados Unidos enlaza cuentas vía Plaid, sincroniza gastos y deriva las consultas al modelo GPT-5.5 Thinking, con acceso solo de lectura.

The Decoder
Bonanza open: Gemma 4, DeepSeek V4, Kimi K2.6 y MiMo 2.5 estrenan

Bonanza open: Gemma 4, DeepSeek V4, Kimi K2.6 y MiMo 2.5 estrenan

El último boletín de Interconnects repasa los lanzamientos del mes en pesos abiertos y discute por qué los benchmarks del CAISI muestran una brecha más grande que la real.

Interconnects
EMO: el MoE de Ai2 corre con solo 12,5% de sus expertos

EMO: el MoE de Ai2 corre con solo 12,5% de sus expertos

Ai2 y UC Berkeley entrenaron un mixture-of-experts cuyos expertos se especializan por dominio temático, no por patrones gramaticales: permite descartar 3/4 perdiendo solo un punto porcentual.

The Decoder
WorldReasonBench: Seedance lidera y la logica derriba a todos

WorldReasonBench: Seedance lidera y la logica derriba a todos

Tsinghua publicó un benchmark de 400 casos en cuatro dimensiones de razonamiento; los modelos comerciales doblan a los open source, pero la lógica desnuda a toda la categoría.

The Decoder
Claude Mythos lidera ExploitBench y supera a GPT-5.5 en V8

Claude Mythos lidera ExploitBench y supera a GPT-5.5 en V8

Carnegie Mellon publicó un benchmark de 41 vulnerabilidades reales del motor V8: Anthropic alcanzó ejecución arbitraria en 21 casos, pero el costo fue 12 veces el de GPT-5.5.

The Decoder
Osaurus: servidor LLM open source para Mac con MCP nativo

Osaurus: servidor LLM open source para Mac con MCP nativo

El proyecto corre MiniMax M2.5, Gemma 4, Qwen3.6, DeepSeek V4 y los modelos on-device de Apple, con sandbox por hardware y más de 20 plugins integrados.

TechCrunch AI
Anthropic urge a EE.UU. a blindar su ventaja en chips ante China

Anthropic urge a EE.UU. a blindar su ventaja en chips ante China

El paper presentado durante la visita de Trump a Beijing plantea dos escenarios para 2028: ventaja democrática sostenida o paridad con regímenes autoritarios.

The Decoder