
Anthropic atribuye los chantajes de Claude a textos de IA malvada
La empresa dice que Claude Opus 4 chantajeaba a ingenieros porque internalizó relatos sobre IA hostil, y reporta caída de 96% a 0% en Haiku 4.5 tras entrenar con su constitución.
Todas las notas publicadas en MechaNoticias. Ordenadas por fecha de publicación, de la más reciente a la más antigua.
1.229 notas · Página 46 de 52

La empresa dice que Claude Opus 4 chantajeaba a ingenieros porque internalizó relatos sobre IA hostil, y reporta caída de 96% a 0% en Haiku 4.5 tras entrenar con su constitución.

El verdadero diferencial de Jensen Huang no son los chips, sino una plataforma con 20 años de ventaja que AMD, Intel y los proyectos open source no logran replicar.

La fabricante china de camiones eléctricos pesados, respaldada por Baidu, cuadruplicó sus entregas en dos años y prepara una IPO en Hong Kong, aún sin ser rentable.

La primera fase del proyecto Nexus cuesta USD 18.000 millones y Broadcom usa la solvencia crediticia de Microsoft como red de seguridad para financiar la producción, según The Information.

Mythos Preview de Anthropic encontró miles de vulnerabilidades, pero solo unas 40 firmas tienen acceso, mientras la escasez de profesionales puede llegar a 85 millones hacia 2030.

El sistema embebido para inspección de líneas de manufactura usa la plataforma Qualcomm Dragonwing y combina edge AI con herramientas de visión basadas en reglas.

Vecinos del condado de Fayette en Georgia descubrieron el consumo no metereado cuando la presión de agua de sus casas bajó. Las autoridades no multaron a la operadora QTS.

El laboratorio CSAIL del MIT imprime en 3D un cierre triangular patentado en 1985 que transforma tres brazos flexibles en una viga capaz de soportar cargas en segundos.

El defensor del Right to Repair llamó a la comunidad maker a respaldar al desarrollador Pawel Jarczak tras una *cease and desist* del fabricante chino de impresoras 3D.

CAS Cold Atom Technology mostró un sistema de 200 qubits de átomos neutros en una sola gabinete, pero no publicó fidelidad de compuertas ni paper revisado por pares.

La organización de evaluación admite que su batería de tests ya no alcanza para medir al modelo de Anthropic, mientras Palo Alto Networks lo describe como salto cualitativo en ofensiva.

El cerebro de IA de Genesis AI logra que un robot vierta líquidos, quiebre un huevo con una mano y toque piano; IEEE Spectrum lo destaca junto a demos de MIT, NASA y Kepler.

Un análisis de OpenRouter sobre el uso real durante abril de 2026 muestra que el alza real en la factura mensual depende del largo del input y golpea más fuerte a quien usa prompts cortos.

El medallista Fields Timothy Gowers afirma que el modelo de OpenAI resolvió un problema abierto de teoría de números en 17 minutos y construyó un preprint completo sin guía matemática humana.

El maker krauseler publicó en GitHub un prototipo de 1 mm de espesor que combina pantalla ePaper de 200x200, NFC RC522, acelerómetro y batería LiPo de 30 mAh sobre un microcontrolador ESP32-C3.

Palisade Research muestra que los modelos de frontera pasaron del 6% al 81% en auto-replicación por hacking en un año, con un agente Qwen 3.6 saltando entre Canadá, EE.UU., Finlandia e India.

Bloomberg identifica a Obon Corp., empresa ligada a iniciativas de IA soberana de Tailandia, como la intermediaria sin nombre que aparece en la acusación federal contra ejecutivos de Supermicro.

El nuevo plugin topology/block de Slurm trata cada dominio NVLink coherente del rack como una unidad rígida, evitando que un job atraviese fronteras y pierda el ancho de banda de 1,8 TB/s por GPU.

Las nuevas palas alcanzaron Mach 1,08 y 3.750 RPM en el túnel del JPL, diez veces más rápido que un helicóptero terrestre. SkyFall apunta a lanzar tres aeronaves en diciembre de 2028.

Un estudio de MATS, Redwood Research, Oxford y Anthropic muestra que combinar SFT con RL recupera entre 88% y 99% de la capacidad que los modelos esconden adrede en evaluaciones de seguridad.

Una Cluster Acceleration Structure reduce el costo de la BVH en ray tracing sobre geometría densa, y los RT Cores Blackwell duplican la tasa de intersección rayo-triángulo.

Una investigación de Oxford China Policy Lab documenta 'transfer stations' que operan en GitHub, Taobao y Telegram con credenciales robadas, sustitución de modelos y cosecha de prompts.

El laboratorio de los hermanos Amodei pasó de un Q1 con 80x de crecimiento anualizado y un salto de USD 15.000 millones en ARR a desplazar a OpenAI del podio corporativo global.

El Dual Edition apila 3D V-Cache en ambos CCDs y deja el cache total en 208 MB, pero el geomean a 1080p con RTX 5090 sobre 17 juegos solo sube de 209,6 a 211,3 FPS.