Como se mencionó anteriormente, existen numerosos sitios web dedicados al cibercrimen, pero extraer sus datos no es legal sin la autorización correspondiente. Sin embargo, todas las técnicas que aprenderás aquí se pueden aplicar fácilmente en entornos autorizados. Debo enfatizar que necesitas permiso explícito antes de probar nada.
Aprenderás a configurar tus propios sitios web localmente utilizando Docker.
Los temas tratados en esta sección incluyen:
- Configuración del foro Clearnet
- Configuración del foro de la red Tor
Configuración del foro Clearnet
Antes de profundizar en esta configuración, déjame explicarte por qué necesitamos dos sitios separados. La razón es prepararte para cualquier escenario: tanto si tu objetivo aloja su sitio en la red Tor como en la Internet normal, tus habilidades deben ser adaptables a cualquier entorno.
Un foro Clearnet te enseña a extraer datos de sitios web utilizando la automatización del navegador. Si alguna vez has utilizado «Inspeccionar elemento» en un sitio y has notado diferencias entre el código fuente de la página y los elementos renderizados, eso es la carga de contenido dinámico, algo que automatizaremos utilizando Playwright.
No vamos a entrar aquí en detalles sobre la configuración del foro, pero te aseguro que solo te llevará unos minutos. Para empezar, abre el siguiente enlace y sigue la guía:
https://github.com/CyberMounties/clearnet_forum
Tu foro debería tener este aspecto después de la configuración:

Si ves nuevos mensajes en «shoutbox» o nuevas publicaciones automáticas en «sellers place», es totalmente intencionado. Es una forma de que el sitio parezca activo con actividad en tiempo real.
También puedes encontrar publicaciones en diferentes idiomas, como ruso, chino y coreano:

Configuración del foro de la red Tor
Un foro Tor tiene una finalidad similar a la de un foro clearnet, pero con una diferencia clave: no utiliza JavaScript. Esto facilita mucho la extracción de datos, ya que todo el contenido se carga directamente desde el backend al frontend. Todo está disponible cuando se ve el código fuente de la página, lo que simplifica la obtención de las páginas.
Para empezar con la configuración, abre el siguiente enlace y sigue la guía:
https://github.com/CyberMounties/tornet_forum
Así es como se ve el foro después de la configuración, imagen del navegador Tor:

Tu tarea es explorar a fondo ambos sitios. Es imprescindible que te familiarices con ellos.