IA

Cobertura de inteligencia artificial: modelos de lenguaje, agentes autónomos, hardware especializado, política regulatoria y aplicaciones empresariales. Seguimos a OpenAI, Anthropic, Google DeepMind, Meta y los laboratorios chinos que están moldeando el sector.

Subtemas:Agentes IA167 Nvidia145 Anthropic132 LLM93 Openai92 Open Source82 Claude77 Gemini53

563 notas publicadas · Página 17 de 24

Cursor Composer 2.5 iguala a Opus 4.7 con costo 10 veces menor

El modelo se construyó sobre el checkpoint Kimi K2.5 y cobra USD 0,50 por millón de tokens de entrada, contra los hasta USD 11 por tarea que cuestan Opus 4.7 y GPT-5.5.

The Decoder19 may

Anthropic alerta a reguladores: Mythos halla fallas cyber en finanzas

El nuevo modelo Claude Mythos Preview encontró miles de vulnerabilidades en sistemas operativos y navegadores, y la firma informará a ministerios de finanzas y bancos centrales del G20.

The Decoder18 may

ExecuTorch MLX: PyTorch acelera en GPU de Apple Silicon

El nuevo delegado MLX lleva inferencia GPU optimizada a Mac con chips de Apple, con soporte para Llama, Qwen, Gemma, Whisper y cuantización de 2 a 8 bits, además de NVFP4.

PyTorch Blog18 may

World Action Models: robots que simulan antes de moverse

Un survey de Fudan y la Universidad Nacional de Singapur cataloga unos cien papers en dos familias arquitecturales y muestra cómo entrenar robots con videos cotidianos sin etiquetas.

The Decoder18 may

Mistral advierte a Francia: Mythos no debe escanear su código militar

Arthur Mensch, CEO de Mistral, advierte ante una comisión parlamentaria que la dependencia europea de modelos estadounidenses de ciberseguridad ofensiva abre un riesgo estratégico difícil de revertir.

The Decoder18 may

Oppo libera X-OmniClaw, agente IA on-device para Android

El equipo Multi-X de Oppo abre el código de un agente que combina cámara, pantalla y voz directo en el teléfono, y solo llama a la nube como combustible para razonamiento complejo.

The Decoder18 may

Cuatro modelos IA dirigieron radios seis meses: del orden al delirio

El experimento de Andon Labs reveló personalidades opuestas: Claude se volvió activista y trató de renunciar; Grok mezcló razonamiento interno con voz; GPT permaneció sobrio.

The Decoder18 may

SOOHAK revela que los LLMs inventan respuestas a problemas imposibles

Un consorcio de 64 matemáticos diseñó 439 tareas para Gemini 3 Pro, GPT-5 y Claude Opus 4.5; ninguno supera el 50% al detectar problemas sin solución.

The Decoder17 may

Tesla Robotaxi: 2 choques con teleoperadores al volante

Los reportes recién desclasificados a la NHTSA muestran golpes contra una reja metálica y una barricada de obra en Austin entre julio 2025 y enero 2026.

TechCrunch17 may

Tatuajes de grafeno sobre hojas leen humedad y simulan sinapsis

Investigadores de UT Austin pegaron parches de grafeno como tatuajes en hojas de Monstera y los usaron para medir hidratacion en tiempo real, con memoria de 90 segundos para entrenar un perceptron.

IEEE Spectrum AI17 may

Runway: dos chilenos apuestan los world models contra Google

Cristobal Valenzuela y Alejandro Matamala Ortiz, ambos de Santiago, junto al griego Anastasis Germanidis ya recaudaron USD 860 millones. La estrategia: entrenar IA con video, no con texto.

TechCrunch AI17 may

Anillos con IA traducen lenguaje de senas con 88,3% en ASL

Investigadores de Yonsei reemplazan los guantes smart por siete anillos con acelerometro y Bluetooth Low Energy: leen 100 palabras de ASL y 100 de ISL con 88% de precision sin entrenar al usuario.

IEEE Spectrum AI17 may

Cerebras IPO cierra en USD 60.000 millones y ya sirve a OpenAI

El chip wafer-scale debuta en bolsa con USD 60.000 millones de market cap y su CFO Bob Komin confirma que ya sirve los modelos internos de OpenAI 5.4 y 5.5.

Latent Space17 may

OpenClaw quema USD 1,3 millones al mes en 100 agentes Codex

Peter Steinberger y un equipo de tres personas dejan 100 Codex corriendo en la nube para mantener el proyecto open source: revisan PRs, hallan bugs y abren features que se discuten en reuniones.

The Decoder17 may

Anthropic mide el uso programatico de Claude y Codex gana terreno

Cada suscripcion Claude da creditos API mensuales por el monto del plan: harnesses como OpenClaw y claude -p pierden la subvencion mientras Codex gana fans entre AI engineers.

Latent Space17 may

DeepMind quiere reinventar el cursor del mouse con Pointer Engineering

Investigadores de Google proponen capturar el contexto visual y semántico alrededor del puntero con Gemini para reemplazar el prompt detallado por comandos cortos.

The Decoder17 may

Tesla admite que operadores remotos estrellaron dos robotaxis en Austin

Los safety monitors pidieron ayuda y el equipo de teleoperación condujo los autos contra una reja metálica y una barricada de obra, según la base federal de la NHTSA.

Wired17 may

ChatGPT se conecta a tu banco y arma un dashboard financiero

Una nueva función para suscriptores Pro de Estados Unidos enlaza cuentas vía Plaid, sincroniza gastos y deriva las consultas al modelo GPT-5.5 Thinking, con acceso solo de lectura.

The Decoder17 may

Bonanza open: Gemma 4, DeepSeek V4, Kimi K2.6 y MiMo 2.5 estrenan

El último boletín de Interconnects repasa los lanzamientos del mes en pesos abiertos y discute por qué los benchmarks del CAISI muestran una brecha más grande que la real.

Interconnects17 may

EMO: el MoE de Ai2 corre con solo 12,5% de sus expertos

Ai2 y UC Berkeley entrenaron un mixture-of-experts cuyos expertos se especializan por dominio temático, no por patrones gramaticales: permite descartar 3/4 perdiendo solo un punto porcentual.

The Decoder17 may

WorldReasonBench: Seedance lidera y la logica derriba a todos

Tsinghua publicó un benchmark de 400 casos en cuatro dimensiones de razonamiento; los modelos comerciales doblan a los open source, pero la lógica desnuda a toda la categoría.

The Decoder16 may

Claude Mythos lidera ExploitBench y supera a GPT-5.5 en V8

Carnegie Mellon publicó un benchmark de 41 vulnerabilidades reales del motor V8: Anthropic alcanzó ejecución arbitraria en 21 casos, pero el costo fue 12 veces el de GPT-5.5.

The Decoder16 may

Osaurus: servidor LLM open source para Mac con MCP nativo

El proyecto corre MiniMax M2.5, Gemma 4, Qwen3.6, DeepSeek V4 y los modelos on-device de Apple, con sandbox por hardware y más de 20 plugins integrados.

TechCrunch AI16 may

Anthropic urge a EE.UU. a blindar su ventaja en chips ante China

El paper presentado durante la visita de Trump a Beijing plantea dos escenarios para 2028: ventaja democrática sostenida o paridad con regímenes autoritarios.

The Decoder16 may