Brief IA · 5 jun

TL;DR

El día está dominado por Anthropic: publica datos duros sobre cuánto código escribe ya Claude de su propio stack y propone, por primera vez de forma oficial, un mecanismo coordinado entre labs para pausar el desarrollo frontier si la mejora recursiva se acelera demasiado.

Lo que ha pasado hoy

Anthropic: Claude escribe ya más del 80 % del código de producción de Anthropic

El 4 de junio, el Anthropic Institute publicó "When AI builds itself", firmado por Marina Favaro (directora del instituto) y Jack Clark (cofundador y jefe de política). El dato central: a mayo de 2026, más del 80 % del código mergeado al repositorio de producción de Anthropic fue escrito por Claude. En febrero de 2025, cuando Claude Code salió en preview de investigación, esa cifra estaba en dígito simple. En Q2 2026, el ingeniero típico mergea 8× más código por día que en 2024. El propio informe matiza que líneas de código es una métrica imperfecta y que el factor 8× "casi con certeza sobreestima la ganancia real de productividad"; una encuesta interna de 130 empleados sitúa la mejora autopercibida en ~4×.

En el benchmark de optimización de código que Anthropic repite en cada modelo (hacer correr más rápido un entrenamiento pequeño), Claude Opus 4 logró ~3× en mayo de 2025; Mythos Preview llegó a ~52× en abril de 2026. Un humano experto tarda entre 4 y 8 horas en alcanzar 4×.

Lo que importa: esto no es un paper teórico sobre AGI. Son métricas internas de un lab que lleva 5 años construyendo modelos. El cuello de botella se ha desplazado: ya no es la generación de código, sino la revisión humana de ese código. (anthropic.com)

Anthropic propone un mecanismo global y verificable para pausar el desarrollo frontier

El mismo informe contiene una propuesta de gobernanza concreta: que los labs frontier de múltiples países acuerden condiciones verificables bajo las cuales ralentizar o pausar el desarrollo si la mejora recursiva supera la capacidad de las instituciones para gestionarla. No es un compromiso unilateral de Anthropic. La condición explícita es que participen simultáneamente labs de EEUU, China y otros países próximos a la frontera.

Jack Clark declaró a BBC News que llegar al 100 % de código escrito por IA podría ocurrir en dos años. El informe compara el reto de verificación con los tratados de control de armas nucleares de la Guerra Fría, pero señala que "los training runs son mucho más fáciles de ocultar que los silos de misiles". Anthropic planea convocar en los próximos meses a legisladores, investigadores y otras empresas para explorar mecanismos de verificación.

La propuesta ya ha recibido críticas: David Sacks, asesor informal de la administración Trump, la ha calificado de "agenda de captura regulatoria". Vale la pena leer el informe teniendo en cuenta que Anthropic lo publica una semana después de presentar confidencialmente su S-1 ante la SEC. (anthropic.com)

Anthropic lanza Claude Opus 4.8 con dynamic workflows y fast mode más barato

En paralelo al informe de gobernanza, Anthropic ha lanzado Claude Opus 4.8. Las novedades operativas relevantes:

Dynamic workflows en Claude Code: el modelo orquesta decenas o cientos de agentes en background para tareas de gran escala. Se accede con /workflows.
Fast mode en Opus 4.8: ahora cuesta 2× la tarifa estándar (antes era significativamente más caro) a cambio de 2,5× la velocidad.
Control de esfuerzo desde claude.ai: los usuarios pueden ajustar cuánto "piensa" el modelo antes de responder.
En el benchmark Online-Mind2Web (computer use y browser agent), Opus 4.8 alcanza 84 %, por encima de Opus 4.7 y GPT-5.5 según datos de clientes citados en el release.
Precio de API: igual que Opus 4.7, sin cambio.

(anthropic.com/news)

GPT-5.5, GPT-5.4 y Codex pasan a disponibilidad general en Amazon Bedrock

El 1 de junio, OpenAI y AWS confirmaron la GA de los modelos frontier de OpenAI en Bedrock, un mes después del preview limitado de abril. Lo relevante para equipos que ya trabajan en AWS:

GPT-5.5 disponible en US East (Ohio); GPT-5.4 en US East (Ohio) y US West (Oregon).
Precios: $5/M tokens de entrada y $30/M de salida para GPT-5.5, idénticos a las tarifas directas de OpenAI. Sin comisión adicional de AWS.
Codex disponible via App, CLI y extensiones de VS Code, JetBrains y Xcode. Pricing por token, sin licencias por asiento ni compromisos por desarrollador. El uso computa contra los compromisos de gasto existentes en AWS.
Codex ha pasado de 4 M a más de 5 M de usuarios semanales durante el mes de preview.
El 3 de junio, GPT-5.4 se extendió también a la región AWS GovCloud (US-West).
Próximo paso anunciado: Daybreak (la iniciativa de ciberseguridad de OpenAI, con GPT-5.5-Cyber) llegará a Bedrock en una fecha aún sin confirmar.

Contexto: la disponibilidad en Bedrock es consecuencia directa del fin de la exclusividad de Microsoft Azure sobre los modelos de OpenAI, renegociada el 27 de abril. (aws.amazon.com · openai.com)

Anthropic presenta el S-1 confidencial ante la SEC

El 1 de junio, Anthropic confirmó que ha presentado confidencialmente un borrador de S-1 ante la SEC. La compañía registró una tasa de ingresos anualizada de $47B en mayo de 2026 y cerró en mayo una ronda Series H de $65B a una valoración post-money de $965B. No hay cifras públicas aún del S-1; el timing de salida a bolsa (verano, otoño, o nunca) sigue sin estar confirmado. El movimiento se lee en el mercado como una señal de que Anthropic quiere llegar a los mercados públicos antes que OpenAI. (anthropic.com/news)

Mistral lanza Vibe: Le Chat se convierte en agente unificado de trabajo y código

Mistral ha renombrado y rediseñado Le Chat como Vibe, un agente único con dos modos:

Work Mode: agente para tareas de larga duración, disponible en web y móvil. Selecciona herramientas, hace streaming del progreso y completa trabajo complejo de forma autónoma.
Code Mode: agente de codificación remota con superficie web dedicada, capaz de abrir pull requests.
Nueva extensión Mistral Vibe para VS Code: el agente trabaja sobre el proyecto completo desde dentro del IDE.

Todos los planes, conversaciones y configuraciones de Le Chat se migran automáticamente a Vibe. (mistral.ai/news)

Si solo lees una cosa

El informe de Anthropic sobre mejora recursiva ("When AI builds itself"). No por la propuesta de pausa —que tiene lecturas políticas legítimas en ambas direcciones— sino por los datos internos: el salto de 3× a 52× en el benchmark de optimización de código en menos de un año, y el desplazamiento del cuello de botella hacia la revisión humana. Son los números más concretos que un lab ha publicado sobre cuánto está acelerando ya su propio desarrollo.