Claude Mythos Resuelve el 73% de Tareas Cibernéticas Expertas que Ninguna IA Pudo Resolver Antes

Claude Mythos Preview de Anthropic se ha convertido en el primer modelo de IA en completar un ataque simulado completo a una red corporativa, según las nuevas evaluaciones del Instituto de Seguridad de IA del Reino Unido (AISI).

Los hallazgos, publicados días después del anuncio del modelo el 7 de abril, sugieren que las capacidades cibernéticas de la IA han alcanzado un nivel que exige atención inmediata de los equipos de seguridad en todo el mundo.

¿Qué es Claude Mythos?

Anthropic presentó su modelo Claude Mythos Preview el 7 de abril, optando por no hacer un lanzamiento público amplio. En su lugar, el equipo otorga acceso limitado a empresas de investigación de seguridad para evaluar y prepararse para sus capacidades avanzadas.

Síguenos en X para obtener las últimas noticias en tiempo real

El desarrollo ya ha comenzado a llamar la atención en círculos tecnológicos e incluso políticos. Según un informe de Reuters que cita fuentes familiarizadas con el asunto, el Secretario del Tesoro de EE. UU. Scott Bessent y el Presidente de la Reserva Federal Jerome Powell mantuvieron una reunión urgente con los directores ejecutivos de los principales bancos, advirtiendo sobre los riesgos cibernéticos potenciales vinculados a este modelo.

Cómo se desempeñó Claude Mythos Preview

El Instituto de Seguridad de IA (AISI), una organización de investigación dentro del Departamento de Ciencia, Innovación y Tecnología del gobierno del Reino Unido, realizó evaluaciones cibernéticas de Claude Mythos Preview de Anthropic para examinar sus capacidades de ciberseguridad.

Primero fueron las evaluaciones capture-the-flag (CTF), donde los sistemas deben identificar y explotar vulnerabilidades para recuperar "banderas" ocultas. Mythos logró una tasa de éxito del 73% en tareas de nivel experto. Esto había permanecido sin resolver por ningún modelo antes de abril de 2025.

Capacidades de ciberataque de Claude Mythos. Fuente: AISI

Además, AISI construyó una simulación de ataque a red corporativa de 32 pasos llamada "The Last Ones" (TLO). Los profesionales de seguridad humanos necesitarían aproximadamente 20 horas para completarla.

Mythos Preview terminó la simulación completa en 3 de 10 intentos. En promedio, completó 22 de los 32 pasos de ataque. Claude Opus 4.6, el siguiente mejor desempeño, promedió solo 16 pasos.

Las pruebas del equipo rojo de Anthropic encontraron que Claude Mythos Preview puede detectar y explotar vulnerabilidades de día cero en todos los principales sistemas operativos y navegadores web líderes cuando es explícitamente instruido por un usuario.

AISI señaló que las organizaciones deben priorizar medidas fundamentales de ciberseguridad. Estas incluyen parches regulares, controles de acceso estrictos, refuerzo de la configuración de seguridad y registro completo.

Suscríbete a nuestro YouTube para ver a líderes y periodistas brindar perspectivas expertas

La publicación Claude Mythos resuelve el 73% de tareas cibernéticas expertas que ninguna IA pudo resolver antes apareció primero en BeInCrypto.

Fuente: https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/

Claude Mythos Resuelve el 73% de Tareas Cibernéticas Expertas que Ninguna IA Pudo Resolver Antes

¿Qué es Claude Mythos?

Cómo se desempeñó Claude Mythos Preview

También te puede interesar

9 Mejores Criptos para Comprar Hoy: Desbloquea APEMARS a $0.00022327 con Potencial de ROI del 2,300%, la Preventa de la Etapa 16 se Calienta Rápidamente

Visa y Stripe se unen a Tempo como validadores iniciales

Resumen Semanal – Bitcoin se Dispara tras el Alto el Fuego

Noticias en tendencia

Roblox Corp. se le ordena establecer oficina en PHL

Bancos saudíes vulnerables a las consecuencias de una guerra prolongada

Experto en XRP Revela La Mejor Forma De Obtener Ingresos Pasivos Con Tus Tenencias

INFORME | Los Hackeos de Web3 Superan los $480 Millones en Pérdidas en el Q1 2026 Impulsados por Ataques de Ingeniería Social, Según Hacken

Los Modelos de IA Ising de NVIDIA Apuntan a los Mayores Cuellos de Botella de la Computación Cuántica

Noticias en vivo 24/7

Precios de criptos