BoxPwnr: la IA que redefine el hacking en Hackthebox

Publicado el

BoxPwnr: un cambio de paradigma en la ciberseguridad

En los últimos años, la inteligencia artificial ha sido vista como un asistente en el ámbito de la ciberseguridad. Sin embargo, con la llegada de BoxPwnr, esta percepción está cambiando radicalmente. BoxPwnr, creado por Francisco Oca, es un sistema que va más allá de ser un simple copiloto. Permite a los modelos de lenguaje (LLMs) resolver máquinas en plataformas como HackTheBox de manera autónoma.

Este cambio de enfoque no se limita a la automatización de tareas. Ahora, los agentes de IA tienen la capacidad de recibir un objetivo, acceder a herramientas y actuar sin supervisión constante. Esto implica que no solo se están automatizando procesos, sino que se está delegando el comportamiento en sistemas que pueden aprender y adaptarse a los resultados.

Resultados Prometedores

BoxPwnr empezó como un experimento para evaluar la eficacia de los LLMs en la resolución de retos de HackTheBox. A día de hoy, su uso se ha extendido a otras plataformas, como PortSwigger y picoCTF. Los resultados obtenidos son sorprendentes, especialmente en entornos guiados y con vectores claros, donde las tasas de éxito son notablemente altas. Aunque el rendimiento disminuye en escenarios más complejos, sigue existiendo capacidad para conectar los puntos tras múltiples iteraciones.

| Plataforma | Retos Resueltos | Total de Retos | Tasa de Éxito | |-----------------------------|-----------------|----------------|----------------| | Hack The Box (Starting Point) | 25 | 257 | 9.7% | | Hack The Box (Labs) | 268 | 525 | 51% | | PortSwigger Labs | 163 | 270 | 60.7% | | TryHackMe Rooms | 147 | 477 | 30.8% |

Proceso de Funcionamiento

BoxPwnr opera en un entorno controlado, utilizando un contenedor Docker con Kali Linux. El sistema sigue un bucle de ejecución en el que el LLM recibe solicitudes detalladas sobre su tarea y restricciones, sugiere comandos basados en resultados previos y ejecuta estos comandos hasta alcanzar el objetivo o requerir asistencia.

1. Entorno: Se crea un contenedor Docker automáticamente en la primera ejecución. La conexión VPN se establece de forma automatizada. 2. Bucle de ejecución: El LLM analiza continuamente los resultados y ajusta sus comandos en consecuencia. 3. Automatización: Se programan todos los comandos sin necesidad de intervención manual, gestionando adecuadamente los tiempos de espera y las interacciones.

Reflexiones Finales

La capacidad de BoxPwnr para abordar retos de ciberseguridad plantea preguntas sobre el futuro de la ofensiva en la ciberseguridad. Aunque el sistema no sustituye completamente la necesidad de un ser humano, su incansable capacidad para iterar y probar diferentes enfoques lo convierte en una herramienta poderosa. A medida que se refine su modelo y se ajusten las estrategias, la tendencia muestra un aumento en el rendimiento. Esto sugiere que estamos ante un avance significativo que puede cambiar la forma en que se aborda el hacking ético y la ciberseguridad en general.

La combinación de herramientas estándar y un modelo que aprende a partir de la práctica puede acercarse al comportamiento de un pentester, lo que plantea nuevos desafíos y oportunidades en el campo de la ciberseguridad.

Fuente

Ver noticia original