
Databricks lanza Omnigent y abre la era de los meta-harnesses
Matei Zaharia apuesta por una arquitectura open source y pluggable que pretende estandarizar cómo se orquestan agentes de código y conocimiento dentro de una organización.
60 notas publicadas

El blueprint open source para agentes de IA de NVIDIA ya tiene una receta lista para Oracle Cloud Infrastructure: Terraform crea el clúster OKE y Helm instala backend, frontend y PostgreSQL.

El nuevo buque insignia de OpenAI lidera benchmarks de coding agéntico y matchea a Mythos en ciberseguridad, pero Washington bloquea el lanzamiento abierto y la empresa critica la decisión.

Matei Zaharia y Reynold Xin presentaron en el Data + AI Summit 2026 una capa comun para Claude Code, Codex, Cursor y agentes internos, ademas de LTAP y Lakebase para reescribir la base de datos.

El modelo Flash ahora ve y opera navegadores, móviles y escritorios por sí solo, con 78,4 en OSWorld y a la par de GPT-5.5.

El reporte interno de OpenAI Economic Research detalla cómo el uso de Codex se profundizó entre noviembre de 2025 y junio de 2026 en investigación, soporte, ingeniería y legal.

Anthropic estrena un agente que vive dentro de Slack, vigila canales sin ser invocado, etiqueta a compañeros responsables del código y dispara fixes cuando un A/B test cruza un guardrail.

Google integra el control de navegador, móvil y escritorio al modelo principal Flash, y suma dos salvaguardas opcionales contra prompt injection pensadas para uso empresarial.

La nueva integración para Slack pone un único @Claude compartido por canal, con acceso a herramientas y código, y queda en beta para clientes Enterprise y Team corriendo sobre Opus 4.8.

La pila reúne modelos abiertos, blueprints y runtime seguro en un mismo stack para que empresas construyan agentes IA especializados sin depender de terceros.

En el DTW Ignite 2026 en Copenhague, la compañía muestra junto a Amdocs, ServiceNow, NTT DATA y TCS un runtime seguro (OpenShell) que orquesta agentes con políticas y sandboxing para redes 5G y 6G.

El Agent Toolkit empaqueta OpenFold3, DiffDock, GenMol, Evo 2 y Parabricks como herramientas callable por agentes vía Model Context Protocol, sobre NIM hosted o local.

El nuevo modelo lidera CyberGym (85,6%) y SEC-bench Pro (69,8%); el programa suma 25 partners como Cisco, CrowdStrike, Cloudflare y Palo Alto Networks.

Sistema japonés coordina modelos como GPT-5.5, Opus 4.8 y Gemini 3.1 Pro vía una API; Fugu Ultra empata con Fable 5 y Mythos Preview en SWE-bench, GPQA y otros.

Apple Cash divide cuentas desde una foto, los Passwords se renuevan solos tras una filtración y Shortcuts ahora se programa describiendo lo que se quiere lograr.

Un agente sobre Copilot Cloud que ataca el viejo problema del self-service de datos a escala empresa, con contexto federado y evaluación obligatoria antes de cada cambio.

Anthropic abre su nuevo tope de gama a USD 10 por millón de tokens de entrada y USD 50 de salida, mientras Mythos 5 va a un grupo cerrado vía Project Glasswing.

Amazon Web Services debutó dos servicios en su Summit de Nueva York: uno automatiza el ciclo de vulnerabilidades de código y otro alimenta agentes con un grafo de conocimiento corporativo.

El skill de Oxford y Stanford corre sobre Claude Opus 4.7, orquesta una redacción virtual de siete roles y deja trazable el 93% de las afirmaciones del artículo final.

Shortcuts Playground, el plugin que liberó MacStories, convierte a los agentes de IA en constructores de automatizaciones de macOS meses antes de la función oficial.

El nuevo 'creative agent' orquesta workflows multi-paso adentro de Creative Cloud y como tool externa en los chats de OpenAI y Anthropic. Beta pública en cinco apps.

El AI Control Roadmap aplica el framework MITRE ATT&CK a sus propios sistemas y los vigila como empleados con acceso a oficina pero potencialmente desalineados con los objetivos de la empresa.

La feature, ya conocida en el chat de Claude, ahora convierte cada sesión de Claude Code en una página web interactiva con historial de versiones y acceso controlado por roles.

El framework entrega una flota de robots y un presupuesto de tokens a 8 agentes Codex para que descubran solos cómo alinear conectores PCIe, ordenar pines metálicos y cortar zip ties.

En HPE Discover Las Vegas, NVIDIA y HPE anuncian la CPU Vera para los ProLiant DL394 Gen12 en 2027, el Agent Toolkit con Nemotron y NemoClaw, y Confidential Computing en todo el portafolio.

El stack llega en beta pública con Cosmos para visión, Nemotron para lenguaje, MCP para datos empresariales y NeMo Agent Toolkit para orquestación, todo bajo licencia abierta en GitHub.

El laboratorio chino Zhipu AI libera bajo licencia MIT un modelo con ventana de 1 millón de tokens que se queda a 1 punto de Anthropic en FrontierSWE.

El proyecto con Carnegie Mellon y UC Berkeley pone a Codex, Claude Code y Kimi Code a escribir el código de entrenamiento, leer papers y coordinar una flota completa por Git.

El CEO de Microsoft publicó su primer artículo en X con la teoría del loop cognitivo entre personas y sistemas digitales: la prioridad no es elegir el mejor modelo, sino construir el ecosistema.

El framework abierto en C/C++ permite construir companions on-device con ASR, SLM y TTS, ya probado en PUBG: BATTLEGROUNDS y Total War: PHARAOH sobre hardware GeForce RTX.

OKF v0.1 estandariza el patrón "LLM wiki" de Karpathy en archivos Markdown con YAML frontmatter, portables entre catálogos, agentes y editores.

El proyecto open source bajo licencia MIT entrega flujos guiados que detectan antipatrones de código y se integran con Claude Code, Gemini CLI, Codex y OpenCode.

El CEO de Microsoft pide no derrochar modelos frontier en tareas cotidianas, pero confiesa: 'también soy token-maxer, es adictivo'.

La compañía replica en C el experimento de provisioning BLE/SoftAP que ya hizo en Rust, ahora con Cursor en Plan mode, Git como red de seguridad y el ESP DualKey de M5Stack en el banco.

El ingeniero detrás del crecimiento de Codex ahora lidera el rediseño completo de ChatGPT como agente personalizado y la fusión con su 'super app' interno.

Peter Steinberger, Boris Cherny de Anthropic y Andrej Karpathy convergen en la misma idea: el cuello de botella ya no es escribir prompts, es seguir como humano dentro del loop.

SWE-Explore, el primer benchmark que aísla la búsqueda de código de la reparación, revela que Claude Code, Codex y OpenHands solo cubren entre 14% y 19% de las líneas que importan.

Las suscripciones de Anthropic y OpenAI quedan en rojo si el usuario las exprime, mientras firmas como Lindy reportan ahorros de millones cambiando Sonnet por DeepSeek V4 sin perder calidad.

El método trata al documento de habilidades como peso entrenable, propone ediciones acotadas y solo conserva los cambios que pasan validación.

Artificial Analysis estrenó el primer benchmark multi-vendor que mide rendimiento concurrente de agentes de IA en cargas reales de coding, con resultados normalizados por acelerador y por megawatt.

Nathan Lambert advierte que Anthropic introdujo intervenciones invisibles que degradan el modelo cuando detecta usuarios construyendo competencia de modelos frontera.

Moonshot AI libera un modelo de pesos abiertos de un billón de parámetros enfocado en programación a USD 0,95 entrada y USD 4 salida por millón de tokens.

El nuevo tope de gama de Anthropic lidera el Artificial Analysis Intelligence Index con 64,9 puntos, pero su corrida completa de benchmarks bordea los USD 10.000, el doble que Opus 4.8.

El GB300 NVL72 corre 20× más agentes por megawatt que el HGX H200 en AgentPerf, el primer benchmark de Artificial Analysis que mide cargas reales de agentes encadenando llamadas LLM.

Anthropic acompaña el lanzamiento con casos reales: Stripe comprimió dos meses de trabajo a un día, Mollick lo dejó trabajar 9,5 horas autónomas y Fable 5 terminó Pokémon FireRed con visión.

Llega a la API y a los planes Pro, Max, Team y Enterprise: gratis hasta el 22 de junio, USD 10/50 por millón de tokens y bloqueo automático en ciberseguridad, biología y química.

Su informe "When AI builds itself" alerta sobre bucles de autoperfeccionamiento, días después de filtrar confidencialmente una IPO valorada cerca de USD 965.000 millones.

Nuevas salvaguardas permiten desplegar un modelo que la empresa antes consideraba demasiado peligroso para liberar. Precio: USD 10 input y USD 50 output por millón de tokens.

El sistema combina mutaciones acotadas, un ledger reproducible y recuperación basada en literatura para iterar estrategias FL más rápido en CIFAR-10 y modelos médicos VLM.

Arduino plantea agentes locales, LLMs compactos y workflows de IA orquestados sobre el UNO Q, que combina Debian Linux con un STM32 en tiempo real en una misma placa.

El nuevo modelo Mixture-of-Experts de NVIDIA promete mayor velocidad, eficiencia en contextos largos y una arquitectura diseñada para flujos de trabajo complejos.

COMPUTEX 2026 y Microsoft Build traen sandboxing nativo con Microsoft eXecution Containers, tensor parallelism en llama.cpp y nuevos modelos Hermes y Holo 3.1 para agentes locales sobre PCs RTX.

Cadence, Dassault Systèmes, Siemens y Synopsys integran el blueprint abierto de NVIDIA para automatizar workflows de CAE y EDA en chips, automóviles y aeroespacial.

Jensen Huang se unió a la keynote de Satya Nadella en Microsoft Build para anunciar RTX Spark, DGX Station, Nemotron 3 Ultra en Foundry, Claude en GB300 Blackwell y OpenShell en Copilot.

La compañía noruega lanzó un agente entrenado sobre su SDK y datos de nRF Cloud que se integra con Claude Code, Cursor o GitHub Copilot vía MCP, con menor costo de tokens que un LLM genérico.

NVIDIA simplifica el despliegue de agentes autónomos locales con NemoClaw, ofreciendo hasta 2.6x más velocidad en inferencia y soporte para clústeres multi-nodo.

TSMC acelera 20-50% la litografía computacional con cuLitho; Foxconn recorta 80% el análisis de causa raíz con MoMClaw; Pegatron baja 67% el deploy de inspección visual con Cosmos.

El Agent Toolkit publica skills en GitHub y skills.sh para que coding agents orquesten datos sintéticos, simulación y deploy sobre Cosmos 3, Isaac, Omniverse, Alpamayo y Jetson.

El blueprint conecta NemoClaw, AI-Q y los modelos Nemotron sobre DGX Station para que Advantech, Foxconn, Pegatron y Wistron operen plantas enteras desde un único agente.

DGX Station for Windows, OpenShell sobre primitivas de seguridad de Microsoft, NemoClaw multiplataforma y 2x rendimiento en llama.cpp con multi-token prediction.
Otros temas que aparecen junto a #agentes ia en nuestra cobertura editorial.