Brief IA · 29 may

TL;DR

La semana del 22-29 de mayo consolida dos tendencias: los modelos frontier ya hacen ciencia autónoma (OpenAI resuelve un problema abierto de Erdős) y la ciberseguridad asistida por IA ha superado la capacidad humana de parchear lo que encuentra (Glasswing, 10.000+ bugs críticos en 30 días).

Lo que ha pasado hoy

Anthropic publica el primer informe de Project Glasswing: 10.000+ vulnerabilidades críticas en un mes

El 22 de mayo, Anthropic publicó la primera actualización oficial de Project Glasswing, su iniciativa de ciberseguridad basada en Claude Mythos Preview —un modelo frontier aún no liberado públicamente—. Los datos son concretos: en cuatro semanas, los ~50 partners del programa han identificado más de 10.000 vulnerabilidades de severidad alta o crítica en software de infraestructura crítica. Cloudflare encontró 2.000 bugs (400 high/critical) con una tasa de falsos positivos inferior a la de testers humanos. Mozilla identificó y parcheó 271 vulnerabilidades en Firefox 150 usando Mythos Preview, diez veces más que en la ronda anterior con Claude Opus 4.6. El caso más concreto: Mythos construyó un exploit funcional contra wolfSSL —librería criptográfica usada en miles de millones de dispositivos— que permitía falsificar certificados HTTPS. Asignado como CVE-2026-5194 y ya parcheado.

El problema que emerge no es ya encontrar bugs, sino parchearlos. El tiempo medio de patch sobre los bugs detectados es de dos semanas, y algunos maintainers de open source han pedido a Anthropic que ralentice las divulgaciones porque no dan abasto. Anthropic reconoce explícitamente que ninguna compañía, incluida ella misma, ha desarrollado aún salvaguardas suficientes para liberar Mythos-class models al público general. Mientras tanto, el programa se expande a gobiernos aliados y más partners.

(anthropic.com/research/glasswing-initial-update)

Un modelo interno de OpenAI refuta una conjetura de geometría de 80 años

El 20 de mayo, OpenAI publicó un resultado que ha pasado revisión externa por matemáticos: un modelo de razonamiento general (no entrenado específicamente para matemáticas) ha refutado la conjetura del problema de distancia unitaria, planteada por Paul Erdős en 1946. La conjetura sostenía que las configuraciones tipo rejilla cuadrada eran esencialmente óptimas para maximizar pares de puntos a distancia 1. El modelo encontró una familia infinita de construcciones que logran una mejora polinomial —concretamente n^(1+δ) para algún δ > 0, refinado a δ = 0.014 por el matemático de Princeton Will Sawin—. Lo notable del método: la prueba conecta el problema de geometría discreta con teoría algebraica de números (torres de campos de clase infinita, teoría de Golod-Shafarevich), una conexión que los matemáticos no habían explorado en este contexto.

La prueba ha sido verificada por un grupo de matemáticos externos, entre ellos Noga Alon (Princeton), quien calificó el resultado de logro sobresaliente. El acompañamiento humano es un paper que explica el argumento y su contexto. OpenAI señala que el resultado es relevante más allá de las matemáticas: un modelo capaz de mantener cadenas de razonamiento largas y conectar campos distantes tiene aplicaciones potenciales en biología, física, ingeniería y medicina.

(openai.com/index/model-disproves-discrete-geometry-conjecture)

Anthropic supera a OpenAI en ARR: ~$30B vs ~$25B en febrero

Un informe publicado el 28 de mayo por 5WPR —con datos de comunicaciones públicas verificadas— recoge que el ARR de Anthropic alcanzó ~$30B en abril de 2026, superando los ~$25B de OpenAI reportados en febrero. El salto es llamativo: en febrero de 2026 Anthropic estaba en $14B de run rate. Eso es casi un doblete en doce semanas. En penetración enterprise: Anthropic declara 8 de las Fortune 10 como clientes; OpenAI está desplegado en el 92% del Fortune 500; Microsoft Copilot supera los 15 millones de asientos de pago. Paralelamente, Dataconomy recoge que Anthropic estaría próxima a su primer trimestre rentable, con una proyección de $10.9B en ingresos y $559M de beneficio operativo para el trimestre que cierra en junio —aunque la compañía no espera mantener esa rentabilidad en trimestres siguientes dado el gasto previsto en compute.

(prnewswire.com — AI Company Comms Study 2026)

OpenAI depreca GPT-4.5 y o3 en ChatGPT; confirma calendario de retirada

Las notas de versión oficiales de OpenAI recogen dos fechas concretas de deprecación en ChatGPT: GPT-4.5 se retira el 27 de junio de 2026 (30 días de sunset) y o3 el 26 de agosto de 2026 (90 días). Estos cambios afectan solo a ChatGPT, no a la API. Además, GPT-5.4 mini ya está disponible para usuarios Free y Go a través de la función "Thinking", y actúa como fallback de GPT-5.4 Thinking cuando se alcanzan los rate limits en cuentas de pago. El modelo no aparece como opción seleccionable en el picker de modelos.

(help.openai.com/en/articles/9624314-model-release-notes)

Google publica EmbeddingGemma: modelo open para embeddings on-device

El 27 de mayo, Google publicó EmbeddingGemma, descrito como el mejor modelo open en su clase para embeddings on-device. El anuncio llega en el blog oficial de desarrolladores de Google, dentro de la familia Gemma. No hay benchmarks públicos detallados en el anuncio inicial más allá del claim de "best-in-class", pero el enfoque on-device es coherente con la arquitectura de Gemma 3n (Per-Layer Embeddings, footprint de 2-3GB en móvil). Es relevante para cualquier stack de RAG o búsqueda semántica que necesite correr localmente sin llamadas a API.

(developers.google.com — Introducing EmbeddingGemma)

Anthropic abre oficina en Milán; nombra director en Corea

Dos movimientos geográficos esta semana en Anthropic: el 27 de mayo anunció la apertura de su oficina en Milán para dar soporte a empresas, investigación y desarrolladores italianos. El día anterior, el 26, nombró a KiYoung Choi como Director Representante de Corea, previo a la apertura de una oficina en Seúl. Son movimientos de expansión enterprise en mercados europeo y asiático, coherentes con la tracción de ingresos reportada.

(anthropic.com/news)

Si solo lees una cosa

El informe de Project Glasswing. No por el número (10.000+ bugs), sino por lo que revela estructuralmente: la velocidad de descubrimiento de vulnerabilidades asistida por IA ya ha superado la capacidad humana de verificar y parchear. El cuello de botella ha cambiado de lado, y eso tiene implicaciones inmediatas para cualquier equipo que mantenga software en producción.