Brief IA · 30 may

TL;DR

El día lo dominan dos movimientos de seguridad: OpenAI formaliza su marco de gobernanza y abre acceso a GPT-Rosalind para biodefensa; Anthropic publica los primeros números reales de Glasswing y son llamativos.

Lo que ha pasado hoy

OpenAI lanza Rosalind Biodefense y amplía acceso a GPT-Rosalind para administraciones públicas

OpenAI ha extendido acceso de confianza a GPT-Rosalind para socios del gobierno de EE.UU. y aliados con misiones aprobadas de salud pública y biodefensa, para que equipos cualificados apliquen IA de frontera a flujos de trabajo de alto impacto como sistemas de alerta temprana, respuesta a brotes, diagnósticos y desarrollo de contramedidas médicas. El programa se llama Rosalind Biodefense y patrocina acceso a GPT-Rosalind, ofrece soporte en el lanzamiento y proporciona herramientas y recursos a desarrolladores de confianza globalmente para crear soluciones de bioseguridad y preparación ante pandemias. La implicación directa: OpenAI está construyendo una capa de acceso diferenciado para modelos con capacidad dual —los mismos que pueden acelerar descubrimientos científicos pueden usarse para daño biológico. El acceso restringido y auditado es la respuesta operativa a ese riesgo. (fuente oficial)

OpenAI publica su Frontier Governance Framework

OpenAI ha publicado su Frontier Governance Framework, que alinea sus prácticas de seguridad, protección y gestión de riesgos de IA con las regulaciones emergentes de la UE y California. No es un documento técnico sino una declaración de posicionamiento regulatorio: OpenAI señaliza que está construyendo los procesos internos que las normativas van a exigir antes de que sean obligatorios. Relevante para cualquier empresa que use la API en Europa o California: la presión regulatoria ya está dando forma a cómo los labs documentan y justifican sus decisiones de despliegue. (fuente oficial)

Anthropic publica el primer update de Project Glasswing: 10.000+ vulnerabilidades críticas en un mes

El mes pasado, Anthropic lanzó Project Glasswing, su esfuerzo colaborativo para asegurar el software más crítico del mundo. Desde entonces, Anthropic y sus aproximadamente 50 socios han usado Claude Mythos Preview para encontrar más de diez mil vulnerabilidades de severidad alta o crítica en el software más sistémicamente importante del mundo. Los números concretos son duros: Cloudflare identificó 2.000 bugs, de los cuales 400 fueron clasificados como de alta o severidad crítica. Mozilla indicó que corrigió 271 vulnerabilidades en Firefox, lo que supone un aumento de diez veces en comparación con los hallazgos de un modelo Claude anterior. En open source, Anthropic dirigió Mythos Preview a escanear más de 1.000 proyectos ampliamente usados y marcó 6.202 vulnerabilidades de alta o severidad crítica. Firmas independientes de seguridad verificaron un subconjunto y confirmaron una tasa de verdaderos positivos del 90,6%.

El caso más concreto: una de las vulnerabilidades de código abierto que Mythos Preview detectó fue en wolfSSL, una librería criptográfica de código abierto conocida por su seguridad y usada por miles de millones de dispositivos. Mythos Preview construyó un exploit que permitiría a un atacante falsificar certificados que (por ejemplo) permitirían alojar un sitio web falso para un banco o proveedor de correo electrónico. El sitio web parecería perfectamente legítimo para un usuario final, a pesar de estar controlado por el atacante. Ya está parcheado (CVE-2026-5194).

La implicación estructural que señala Anthropic es importante: el progreso en seguridad de software solía estar limitado por la rapidez con la que podíamos encontrar nuevas vulnerabilidades. Ahora está limitado por la rapidez con la que podemos verificar, divulgar y parchear el gran número de vulnerabilidades encontradas por IA. El cuello de botella ha cambiado de lado. (fuente oficial)

Gemini 3.5 Flash ya está disponible globalmente; Google baja el precio de Ultra a $200/mes

Google ha introducido Gemini 3.5, su última familia de modelos que combina inteligencia de frontera con acción. Arranca con 3.5 Flash, que ofrece rendimiento de frontera para agentes y codificación, destacando en tareas complejas de largo horizonte que aportan utilidad real. Los benchmarks publicados: supera a Gemini 3.1 Pro en benchmarks exigentes de codificación y agentes como Terminal-Bench 2.1 (76,2%), GDPval-AA (1656 Elo) y MCP Atlas (83,6%), y lidera en comprensión multimodal (84,2% en CharXiv Reasoning). En tokens de salida por segundo, es 4 veces más rápido que otros modelos de frontera.

En paralelo, Google lanzó Gemini 3.5 Flash y redujo la suscripción Ultra de 250 a 200 dólares al mes. Google introdujo también un nuevo tier Developer a 100 dólares al mes para ingenieros y usuarios profesionales. La jugada de precios es clara: Google está comprimiendo márgenes para competir con OpenAI y Anthropic en enterprise. (fuente oficial)

OpenAI: Codex construye agentes fiscales que se auto-mejoran

OpenAI publicó el 27 de mayo un post de ingeniería titulado "Building self-improving tax agents with Codex", que describe cómo usan su propia herramienta de agentes de código para construir sistemas que se refinan a sí mismos en dominios regulados. Es una demostración interna de uso real de Codex en producción, no un paper teórico. Lo relevante para builders: Appshots en la app de Codex para macOS permiten adjuntar una ventana de aplicación a un hilo de Codex con un atajo de teclado, incluyendo una captura de pantalla y el texto disponible. El modo Goal está disponible de forma general en la app Codex, la extensión IDE y la CLI, para que puedas definir un resultado y criterios de éxito y dejar que Codex siga trabajando hacia ese objetivo. (fuente oficial)

Anthropic: Claude Mythos Preview también encuentra vulnerabilidades que llevan décadas sin detectar

Los primeros resultados son llamativos: Anthropic reporta miles de vulnerabilidades zero-day previamente desconocidas en los principales sistemas operativos y navegadores web, incluyendo un bug en OpenBSD que supuestamente había pasado desapercibido durante 27 años. Esto refuerza el argumento de Anthropic para mantener Mythos fuera del acceso público: Anthropic está reteniendo explícitamente Claude Mythos Preview porque las mismas capacidades que lo convierten en una poderosa herramienta defensiva también lo convierten en una herramienta ofensiva peligrosa. La decisión de no liberar el modelo mientras se ejecuta el programa de divulgación coordinada es, en este contexto, la única posición técnicamente coherente. (fuente oficial)

Si solo lees una cosa

El update de Project Glasswing. No por el número de vulnerabilidades —aunque 10.000 en un mes con una tasa de falsos positivos inferior a la de testers humanos es un dato que merece atención—, sino porque invierte el problema central de la seguridad de software: encontrar bugs ya no es el cuello de botella, parchearlo a tiempo sí. Eso cambia cómo tienes que pensar tu pipeline de dependencias a partir de ahora.