
Claude Mythos, el nuevo modelo de inteligencia artificial (IA) de Anthropic desarrollado para ayudar en la seguridad defensiva, tiene la capacidad de atacar de manera autónoma a empresas pequeñas que cuentan con protecciones débiles.
Claude Mythos es un modelo de Anthropic diseñado para detectar vulnerabilidades de alta gravedad en los principales sistemas operativos y navegadores web, con el que la compañía pretende "transformar la ciberseguridad".
El Instituto de Seguridad de la IA (AISI, por sus siglas en inglés), perteneciente al Departamento de Ciencia, Innovación y Tecnología del gobierno del Reino Unido, ha puesto a prueba las capacidades de este modelo, aprovechando su disponibilidad en vista previa, con evaluaciones controladas que incluyeron sondeos basados en chat, desafíos de captura de bandera y simulaciones de ciberataques de múltiples pasos.
En ellas, "observamos que podía ejecutar ataques de varias etapas en redes vulnerables y descubrir y explotar vulnerabilidades de forma autónoma, tareas que requerirían días de trabajo para los profesionales humanos", indican desde AISI en una publicación compartida en su blog.
Asimismo, señalan que las capacidades de Claude Mythos permitirían atacar de manera autónoma a pequeñas empresas que no cuentan con sistemas de defensa sólidos, pero no llegan a afirmar que el modelo sea capaz de atacar sistemas "bien protegidos".
Esto se debe principalmente a que que reconocen que hay diferencias entre los entornos de evaluación, sin características de seguridad ni penalizaciones, y los entornos reales, lo que ha llevado a AISI a decidir que en evaluaciones futuras se utilizarán "campos de pruebas que simulen entornos reforzados y protegidos", para poder evaluar correctamente las capacidades de los modelos más avanzados.
completa toda los campos para contáctarnos