Como se mencionó anteriormente, existen numerosos sitios web dedicados al cibercrimen, pero extraer sus datos no es legal sin la autorización correspondiente. Sin embargo, todas las técnicas que aprenderás aquí se pueden aplicar fácilmente en entornos autorizados. Debo enfatizar que necesitas permiso explícito antes de probar nada.

Aprenderás a configurar tus propios sitios web localmente utilizando Docker.

Los temas tratados en esta sección incluyen:

  1. Configuración del foro Clearnet
  2. Configuración del foro de la red Tor

Configuración del foro Clearnet

Antes de profundizar en esta configuración, déjame explicarte por qué necesitamos dos sitios separados. La razón es prepararte para cualquier escenario: tanto si tu objetivo aloja su sitio en la red Tor como en la Internet normal, tus habilidades deben ser adaptables a cualquier entorno.

Un foro Clearnet te enseña a extraer datos de sitios web utilizando la automatización del navegador. Si alguna vez has utilizado «Inspeccionar elemento» en un sitio y has notado diferencias entre el código fuente de la página y los elementos renderizados, eso es la carga de contenido dinámico, algo que automatizaremos utilizando Playwright.

No vamos a entrar aquí en detalles sobre la configuración del foro, pero te aseguro que solo te llevará unos minutos. Para empezar, abre el siguiente enlace y sigue la guía:

https://github.com/CyberMounties/clearnet_forum

Tu foro debería tener este aspecto después de la configuración:

Primer vistazo al foro Clearnet

Si ves nuevos mensajes en «shoutbox» o nuevas publicaciones automáticas en «sellers place», es totalmente intencionado. Es una forma de que el sitio parezca activo con actividad en tiempo real.

También puedes encontrar publicaciones en diferentes idiomas, como ruso, chino y coreano:

Clearnet Forum - Sellers Marketplace


Configuración del foro de la red Tor

Un foro Tor tiene una finalidad similar a la de un foro clearnet, pero con una diferencia clave: no utiliza JavaScript. Esto facilita mucho la extracción de datos, ya que todo el contenido se carga directamente desde el backend al frontend. Todo está disponible cuando se ve el código fuente de la página, lo que simplifica la obtención de las páginas.

Para empezar con la configuración, abre el siguiente enlace y sigue la guía:

https://github.com/CyberMounties/tornet_forum

Así es como se ve el foro después de la configuración, imagen del navegador Tor:

Primer vistazo al foro Tornet


Tu tarea es explorar a fondo ambos sitios. Es imprescindible que te familiarices con ellos.