Comme mentionné précédemment, il existe de nombreux sites consacrés à la cybercriminalité en ligne, mais il est illégal d'extraire leurs données sans autorisation préalable. Cependant, toutes les techniques que vous apprendrez ici peuvent être facilement appliquées dans des environnements autorisés. Je tiens à souligner que vous devez obtenir une autorisation explicite avant de tester quoi que ce soit.

Vous apprendrez à configurer vos propres sites localement à l'aide de Docker.

Les sujets abordés dans cette section sont les suivants :

  1. Configuration du forum Clearnet
  2. Configuration du forum du réseau Tor

Configuration du forum Clearnet

Avant de nous plonger dans cette configuration, laissez-moi vous expliquer pourquoi nous avons besoin de deux sites distincts. La raison est de vous préparer à tous les scénarios : que votre cible héberge son site sur le réseau Tor ou sur l'Internet classique, vos compétences doivent pouvoir s'adapter à n'importe quel environnement.

Un forum Clearnet vous apprend à extraire des données de sites web à l'aide de l'automatisation des navigateurs. Si vous avez déjà utilisé la fonction « Inspecter l'élément » sur un site et remarqué des différences entre le code source de la page et les éléments affichés, il s'agit du chargement de contenu dynamique, que nous allons automatiser à l'aide de Playwright.

Nous ne discuterons pas ici de la configuration détaillée du forum, mais je peux vous assurer que cela ne prend que quelques minutes. Pour commencer, ouvrez le lien suivant et suivez le guide :

https://github.com/CyberMounties/clearnet_forum

Votre forum devrait ressembler à ceci après la configuration :

Clearnet Forum First Look

Si vous voyez de nouveaux messages dans « shoutbox » ou de nouveaux messages automatiquement publiés dans « sellers place », c'est tout à fait normal. C'est un moyen pour moi de donner au site un aspect vivant avec une activité en temps réel.

Vous pouvez également trouver des messages dans différentes langues telles que le russe, le chinois et le coréen :

Forum Clearnet - Marché des vendeurs


Configuration du forum sur le réseau Tor

Un forum Tor a un objectif similaire à celui d'un forum clearnet, mais avec une différence essentielle : il n'utilise pas JavaScript. Cela facilite grandement l'extraction des données, car tout le contenu est chargé directement du backend vers le frontend. Tout devient disponible lorsque vous consultez le code source de la page, ce qui simplifie la récupération des pages.

Pour commencer la configuration, ouvrez le lien suivant et suivez le guide :

https://github.com/CyberMounties/tornet_forum

Voici à quoi ressemble le forum après la configuration, image provenant du navigateur Tor :

Premier aperçu du forum Tornet


Il vous appartient d'explorer ces deux sites en détail. Il est indispensable de vous familiariser avec le site.