
Anthropic atribuye los chantajes de Claude a textos de IA malvada
La empresa dice que Claude Opus 4 chantajeaba a ingenieros porque internalizó relatos sobre IA hostil, y reporta caída de 96% a 0% en Haiku 4.5 tras entrenar con su constitución.
Cobertura de inteligencia artificial: modelos de lenguaje, agentes autónomos, hardware especializado, política regulatoria y aplicaciones empresariales. Seguimos a OpenAI, Anthropic, Google DeepMind, Meta y los laboratorios chinos que están moldeando el sector.

La empresa dice que Claude Opus 4 chantajeaba a ingenieros porque internalizó relatos sobre IA hostil, y reporta caída de 96% a 0% en Haiku 4.5 tras entrenar con su constitución.

El verdadero diferencial de Jensen Huang no son los chips, sino una plataforma con 20 años de ventaja que AMD, Intel y los proyectos open source no logran replicar.

La primera fase del proyecto Nexus cuesta USD 18.000 millones y Broadcom usa la solvencia crediticia de Microsoft como red de seguridad para financiar la producción, según The Information.

Mythos Preview de Anthropic encontró miles de vulnerabilidades, pero solo unas 40 firmas tienen acceso, mientras la escasez de profesionales puede llegar a 85 millones hacia 2030.

La organización de evaluación admite que su batería de tests ya no alcanza para medir al modelo de Anthropic, mientras Palo Alto Networks lo describe como salto cualitativo en ofensiva.

Un análisis de OpenRouter sobre el uso real durante abril de 2026 muestra que el alza real en la factura mensual depende del largo del input y golpea más fuerte a quien usa prompts cortos.

El medallista Fields Timothy Gowers afirma que el modelo de OpenAI resolvió un problema abierto de teoría de números en 17 minutos y construyó un preprint completo sin guía matemática humana.

Palisade Research muestra que los modelos de frontera pasaron del 6% al 81% en auto-replicación por hacking en un año, con un agente Qwen 3.6 saltando entre Canadá, EE.UU., Finlandia e India.

El nuevo plugin topology/block de Slurm trata cada dominio NVLink coherente del rack como una unidad rígida, evitando que un job atraviese fronteras y pierda el ancho de banda de 1,8 TB/s por GPU.

Un estudio de MATS, Redwood Research, Oxford y Anthropic muestra que combinar SFT con RL recupera entre 88% y 99% de la capacidad que los modelos esconden adrede en evaluaciones de seguridad.

El laboratorio de los hermanos Amodei pasó de un Q1 con 80x de crecimiento anualizado y un salto de USD 15.000 millones en ARR a desplazar a OpenAI del podio corporativo global.

El modo Prometheus de NCCL 2.30 expone métricas GPU-a-GPU como series temporales para Grafana, sin el archivo JSON intermedio que se usaba para análisis offline.

La nueva versión soporta razonamiento intercalado con tool calls, streaming de despacho y un flag que restaura el caché de prefijo en servicios de inferencia custom.

El AI Red Team de NVIDIA aplicó decodificación restringida por gramática a 13 modelos pequeños y subió el pass rate promedio de 62,5% a 75,2% en 299 tareas de shell.

Receta paso a paso de post-training quantization con ModelOpt que lleva CLIP-ViT-L-14 de FP16 a FP8 sin perder calidad en clasificación zero-shot ni retrieval.

Simon Willison se hace eco de un argumento del equipo de Anthropic: pedir respuestas en HTML deja a Claude usar SVG, widgets interactivos y navegación en página, recursos imposibles en Markdown plano.

El acceso anticipado al modelo de Anthropic permitió a Mozilla pasar de 20-30 vulnerabilidades resueltas por mes en 2025 a 423 solo en abril de 2026.

Elon Musk anunció el acuerdo pese a sus críticas pasadas a Anthropic. La planta arrastra denuncias por turbinas de gas en Memphis sin permisos de la Clean Air Act.

Un año después del lanzamiento, el agente potenciado con Gemini ya optimiza chips, redes eléctricas y problemas matemáticos abiertos como Ramsey o el problema del viajante.

Auto-mejora recursiva, Darwin Gödel Machines y AlphaEvolve: el reportaje de IEEE Spectrum sobre cuánto código de los modelos ya lo escriben otros modelos.

Un neurocientífico de Yale propone cuatro reglas mínimas para chatbots: identidad clara, detección de crisis, límites conversacionales y auditoría externa.

Emilia Javorsky, doctora y directora en el Future of Life Institute, sostiene que la IA actual ya acelera detección y tratamientos contra el cáncer; la apuesta a una ASI futura desvía recursos.

Una rebaja arancelaria canadiense permite a Tesla importar los sedán de Giga Shanghai, dejando el modelo de entrada en CAD 39.490, casi la mitad del precio que tenían los Model 3 hechos en California.

El CEO de Nvidia refuta las predicciones catastrofistas sobre destrucción masiva de empleos por IA, recordando que los radiólogos que Geoffrey Hinton dio por extintos hace una década siguen escasos.