Claude Mythos Preview de Anthropic se ha convertido en el primer modelo de IA en completar un ataque simulado completo a una red corporativa, según las nuevas evaluaciones del Instituto de Seguridad de IA del Reino Unido (AISI).
Los hallazgos, publicados días después del anuncio del modelo el 7 de abril, sugieren que las capacidades cibernéticas de la IA han alcanzado un nivel que exige atención inmediata de los equipos de seguridad en todo el mundo.
¿Qué es Claude Mythos?
Anthropic presentó su modelo Claude Mythos Preview el 7 de abril, optando por no hacer un lanzamiento público amplio. En su lugar, el equipo otorga acceso limitado a empresas de investigación de seguridad para evaluar y prepararse para sus capacidades avanzadas.
Síguenos en X para obtener las últimas noticias en tiempo real
El desarrollo ya ha comenzado a llamar la atención en círculos tecnológicos e incluso políticos. Según un informe de Reuters que cita fuentes familiarizadas con el asunto, el Secretario del Tesoro de EE. UU. Scott Bessent y el Presidente de la Reserva Federal Jerome Powell mantuvieron una reunión urgente con los directores ejecutivos de los principales bancos, advirtiendo sobre los riesgos cibernéticos potenciales vinculados a este modelo.
Cómo se desempeñó Claude Mythos Preview
El Instituto de Seguridad de IA (AISI), una organización de investigación dentro del Departamento de Ciencia, Innovación y Tecnología del gobierno del Reino Unido, realizó evaluaciones cibernéticas de Claude Mythos Preview de Anthropic para examinar sus capacidades de ciberseguridad.
Primero fueron las evaluaciones capture-the-flag (CTF), donde los sistemas deben identificar y explotar vulnerabilidades para recuperar "banderas" ocultas. Mythos logró una tasa de éxito del 73% en tareas de nivel experto. Esto había permanecido sin resolver por ningún modelo antes de abril de 2025.
Capacidades de ciberataque de Claude Mythos. Fuente: AISIAdemás, AISI construyó una simulación de ataque a red corporativa de 32 pasos llamada "The Last Ones" (TLO). Los profesionales de seguridad humanos necesitarían aproximadamente 20 horas para completarla.
Mythos Preview terminó la simulación completa en 3 de 10 intentos. En promedio, completó 22 de los 32 pasos de ataque. Claude Opus 4.6, el siguiente mejor desempeño, promedió solo 16 pasos.
Las pruebas del equipo rojo de Anthropic encontraron que Claude Mythos Preview puede detectar y explotar vulnerabilidades de día cero en todos los principales sistemas operativos y navegadores web líderes cuando es explícitamente instruido por un usuario.
AISI señaló que las organizaciones deben priorizar medidas fundamentales de ciberseguridad. Estas incluyen parches regulares, controles de acceso estrictos, refuerzo de la configuración de seguridad y registro completo.
Suscríbete a nuestro YouTube para ver a líderes y periodistas brindar perspectivas expertas
La publicación Claude Mythos resuelve el 73% de tareas cibernéticas expertas que ninguna IA pudo resolver antes apareció primero en BeInCrypto.
Fuente: https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/








