
OpenAI lanza GPT-5.5: el modelo Spud que busca frenar a Anthropic
El modelo reentrenado Spud llega a ChatGPT y Codex con mejoras en razonamiento y codificación, aunque la API sigue sin fecha de lanzamiento oficial.
Todas las notas publicadas en MechaNoticias. Ordenadas por fecha de publicación, de la más reciente a la más antigua.
1.216 notas · Página 51 de 51

El modelo reentrenado Spud llega a ChatGPT y Codex con mejoras en razonamiento y codificación, aunque la API sigue sin fecha de lanzamiento oficial.

El nuevo modelo de OpenAI promete capacidades superiores en razonamiento y uso de herramientas, marcando un cambio en la estrategia de precios para desarrolladores.

NVIDIA NeMo RL optimiza el rendimiento del aprendizaje por refuerzo mediante cuantización FP8, logrando mayor velocidad sin perder precisión en modelos de lenguaje.

En Hannover Messe 2026, NVIDIA despliega infraestructuras de IA soberana, gemelos digitales en tiempo real y robots humanoides para transformar la industria global.

La alianza presenta infraestructura Vera Rubin, GPUs Blackwell y nuevas herramientas para escalar gemelos digitales y agentes autónomos en la nube.

Jakub Pachocki promete mejoras "extremadamente significativas" en el mediano plazo, mientras un sector creciente de investigadores cuestiona si los LLMs son el camino correcto.

Cambios en razonamiento, caché y longitud de respuesta se combinaron durante semanas para degradar la calidad del agente sin ser detectados por los equipos internos.

Una protesta de 40.000 trabajadores sindicalizados en Pyeongtaek amenaza con profundizar el déficit global de DRAM y NAND ya proyectado hasta 2030.

GPT-5.5 promete avances en coding agéntico y menor consumo de tokens, pero el precio del API igual sube cerca del 20% según los primeros tests publicados.

BankerToolBench evalúa GPT-5.4, Claude Opus 4.6 y Gemini 3.1 Pro en tareas reales de banca de inversión, y la mitad de los outputs falla incluso como borrador inicial.

La nueva capa de memoria guarda lecciones entre sesiones, mantiene los archivos inspeccionables y permite migrarlos a otro proveedor sin lock-in.

Guía práctica para correr modelos como Llama o Mistral en tu computador con Ollama y LM Studio: privacidad total, sin la nube.

OpenAI recupera el liderazgo en benchmarks de IA con GPT-5.5, pero su modelo tiene una tasa de alucinación del 86%, muy superior al 36% de Claude Opus 4.7.

Moonshot AI lanza un agente de programación que ejecuta 300 subagentes en paralelo y ofrece precios de API entre 5 y 6 veces inferiores a Claude Sonnet 4.6.

Los modelos V4-Pro y V4-Flash de pesos abiertos logran ventanas de contexto de un millón de tokens con una drástica reducción en el costo de cómputo.

Aprovecha el poder de la arquitectura híbrida de DeepSeek V4 y la plataforma NVIDIA Blackwell para inferencia de contexto largo y flujos agénticos.