
Gemini-SQL2 de Google lidera benchmark text-to-SQL con 80% de precisión
Construido sobre Gemini 3.1 Pro, el sistema de Google Research aventaja por más de siete puntos a GPT-5.5-xhigh y casi diez a Claude Opus 4.6 en el ranking BIRD.
Todas las notas publicadas en MechaNoticias. Ordenadas por fecha de publicación, de la más reciente a la más antigua.
1.479 notas · Página 12 de 62

Construido sobre Gemini 3.1 Pro, el sistema de Google Research aventaja por más de siete puntos a GPT-5.5-xhigh y casi diez a Claude Opus 4.6 en el ranking BIRD.

El Sovereign AI Innovation Lab convivirá con la supercomputadora Zenith y el sistema Sunrise de fusión nuclear, todos sobre arquitectura AMD EPYC + Instinct MI355X integrada por Dell.

El proyecto open hardware de 3DprintedLife convierte cada figura en un micro-robot autónomo con stepper duales, magnetómetro y batería LiPo de 170 mAh.

Las suscripciones de Anthropic y OpenAI quedan en rojo si el usuario las exprime, mientras firmas como Lindy reportan ahorros de millones cambiando Sonnet por DeepSeek V4 sin perder calidad.

El proyecto ReD, con la Universidad Técnica de Delft, simula la sorpresa cognitiva del conductor para fijar un benchmark común de evitación de colisiones para autos autónomos.

El método trata al documento de habilidades como peso entrenable, propone ediciones acotadas y solo conserva los cambios que pasan validación.

Un paper de seguridad interno y una llamada del CEO Andy Jassy a la administración Trump precipitaron la orden de control de exportación que dejó a Anthropic sin Fable 5 ni Mythos 5 para extranjeros.

El primer servidor SCaled Accelerated Data Access para IA empaca 96 SSDs PCIe 6.0 Micron 9650 Pro, CPU NVIDIA Vera y cuatro RTX Pro 6000 Blackwell en 6U.

El youtuber Tech Talkies armó un par de handhelds con XIAO ESP32S3 Sense, amplificador MAX98357 y batería 18650 que se comunican por ESP-NOW a más de 200 metros sin Wi-Fi ni internet.

Artificial Analysis estrenó el primer benchmark multi-vendor que mide rendimiento concurrente de agentes de IA en cargas reales de coding, con resultados normalizados por acelerador y por megawatt.

La directiva de control de exportaciones prohíbe el acceso a cualquier extranjero, incluidos empleados de Anthropic, y deja a la empresa sin opción de bloqueo selectivo en tiempo real.

Familia de microcontroladores chinos combina un núcleo RISC-V de 48 MHz con un motor de control FOC dedicado y se vende a USD 0,02 por unidad en pedidos de cientos.

Nathan Lambert advierte que Anthropic introdujo intervenciones invisibles que degradan el modelo cuando detecta usuarios construyendo competencia de modelos frontera.

Moonshot AI libera un modelo de pesos abiertos de un billón de parámetros enfocado en programación a USD 0,95 entrada y USD 4 salida por millón de tokens.

El nuevo tope de gama de Anthropic lidera el Artificial Analysis Intelligence Index con 64,9 puntos, pero su corrida completa de benchmarks bordea los USD 10.000, el doble que Opus 4.8.

MotionDisco descubre comportamientos de loco-manipulación humanoide sin teleoperación, mientras DEEP Robotics, Agility y MIT muestran nuevos avances en destreza y manipulación.

Crónica de una educadora maker que cruzó el Atlántico para descubrir cómo se vive el movimiento maker en República Checa, con Prusa Lab como anfitrión y más de 200 proyectos en exhibición.

Apple presentó en WWDC 2026 una Siri rediseñada sobre Google Gemini, una nueva generación de Apple Intelligence y un iOS 27 que llega a todos los iPhone desde el 11 en adelante.

Panel del Robotics Summit 2026 con líderes de Boston Dynamics, Agility, Schaeffler y RealSense discutió escala industrial, sim2real y la economía del humanoide de USD 20.000.

La logística multimillonaria pasa del piloto a la compra después de promediar 1,55 kWh por milla en 4.494 millas con su flota piloto de 2025, un 9% mejor que cifras previas de DHL y Saia.

Programa de seis meses para startups británicas y europeas de robótica que combina la nube AI de Nebius con la pila completa de NVIDIA, incluyendo Cosmos, Isaac y GPUs RTX PRO.

El módulo de bolsillo basado en Stamp-S3A suma IMU de 6 ejes, micrófono MEMS, transmisor IR y batería de 250 mAh para control de actitud, audio y aplicaciones IoT de bajo consumo.

La empresa recibió una directiva de export control citando seguridad nacional y un supuesto jailbreak. Anthropic argumenta que la vulneración es menor y contradice principios de proceso justo.

El nuevo modelo MoE de pesos abiertos genera párrafos enteros en paralelo mediante denoising, corre con 18 GB de VRAM y entrega hasta 4× más velocidad que Gemma 4 26B en una sola H100.