La IA fronteriza ya puede hackear redes empresariales sola

La capacidad ofensiva ya no es teórica

En abril de 2026, dos modelos de inteligencia artificial demostraron que pueden ejecutar ataques cibernéticos completos de forma autónoma, sin intervención humana. Anthropic lanzó Claude Mythos Preview el 7 de abril; OpenAI siguió con GPT-5.5 el 23 del mismo mes. Ambos cruzaron una línea que la industria de seguridad llevaba años anticipando pero pocos creían tan cercana.

Qué hicieron exactamente

El AI Safety Institute del Reino Unido (AISI, por sus siglas en inglés) — un organismo gubernamental dedicado a evaluar la seguridad de los modelos de IA más avanzados — evaluó ambos modelos en pruebas de ciberseguridad diseñadas para simular intrusiones reales en redes empresariales. "The Last Ones" es una simulación de 32 pasos que abarca reconocimiento, robo de credenciales, movimiento lateral entre bosques de Active Directory, pivotaje en la cadena de suministro de un sistema CI/CD y exfiltración de bases de datos protegidas. Un experto humano tarda unas 20 horas en completar la secuencia completa.

Claude Mythos Preview resolvió "The Last Ones" en 6 de cada 10 intentos en su versión más reciente. También completó "Cooling Tower", una simulación de ataque a sistemas de control industrial que nadie había resuelto antes, en 3 de cada 10 intentos. GPT-5.5 resolvió "The Last Ones" en 3 de cada 10 intentos. En la suite de 95 tareas de ciberseguridad del AISI, GPT-5.5 logró un 71.4% de aprobación en tareas de nivel experto, mientras que Mythos alcanzó 68.6%.

Una carrera que se acelera

La velocidad de progreso es lo verdaderamente preocupante. En noviembre de 2025, el AISI estimó que las capacidades cibernéticas de la IA fronteriza se duplicaban cada 8 meses. En febrero de 2026, revisó esa cifra a 4,7 meses. Ahora, con Mythos y GPT-5.5, el ritmo se ha acelerado a aproximadamente 4 meses. METR, una organización sin fines de lucro que mide la autonomía del software con IA, arrive a una cifra casi idéntica.

Lo que esto significa en la práctica: la capacidad cibernética ofensiva de la IA no está mejorando de forma gradual. Está creciendo de manera exponencial, y el ritmo de esa exponencial también está creciendo.

El peligro no es el hacker solitario

Thorsten Holz, investigador del Instituto Max Planck, lo puso en perspectiva: "No, un individuo no puede hackear un banco con Claude Mythos. No es tan simple." En pruebas del instituto, Mythos explotó exitosamente 157 de 898 vulnerabilidades reales, y GPT-5.5 logró 120. El siguiente modelo mejor, Claude Opus 4.6, solo alcanzó 15.

El riesgo real viene de actores organizados que integran estos modelos en sistemas de ataque automatizados, haciéndolos más eficientes y poderosos. Palo Alto Networks estima que las organizaciones tienen una ventana de tres a cinco meses para ponerse al día antes de que las explotaciones impulsadas por IA se conviertan en la norma.

La defensa también se acelera

El lado defensivo no se queda quieto. Project Glasswing, una iniciativa de Anthropic con más de 100 millones de dólares, involucra a AWS, Apple, Google, Microsoft, NVIDIA, CrowdStrike y Palo Alto Networks para deployar Mythos en la defensa. OpenAI lanzó GPT-5.5-Cyber a través de su programa Trusted Access for Cyber, con verificación de identidad obligatoria. Mozilla reportó que Mythos identificó 271 vulnerabilidades corregidas en una sola versión de Firefox, un aumento de un orden de magnitud respecto a esfuerzos anteriores con IA.

La pregunta ya no es si la IA puede hackear. Es si los defensores pueden adaptarse lo suficientemente rápido antes de que la capacidad ofensiva los supere de forma definitiva.

Fuentes

UK AI Security Institute: "How fast is autonomous AI cyber capability advancing?" (mayo 2026)
UK AI Security Institute: "Our evaluation of OpenAI's GPT-5.5 cyber capabilities" (mayo 2026)
Palo Alto Networks: "Defender's Guide to the Frontier AI Impact on Cybersecurity" (mayo 2026)
Instituto Max Planck: "Claude Mythos, ChatGPT-5.5 and cybersecurity" (mayo 2026)
CyberScoop: "Researchers say AI just broke every benchmark for autonomous cyber capability" (mayo 2026)
Australian Cyber Security Centre: "Frontier AI models and their impact on cyber security" (abril 2026)