Xenu le petit alien-robot
Si vous devez effectuer une migration, que vous reprenez en main un site, vous serez surement amené à vérifier les liens qui s’y trouvent, surtout si vous êtes friands de références et de screenshots. Ça tombe bien, Xenu fait ce job.
Il s’agit d’un petit logiciel qui va vérifier tous les liens figurant sur un site Web, y compris les adresses emails disséminées ici et là. Relativement simple d’utilisation, il l’avantage de son inconvénient, à savoir ne pas être suffisamment puissant pour être détecté comme un scanner quelconque par les systèmes de monitoring de sites, ce qui a l’avantage de ne pas pourrir les logs. Néanmoins, sa présence est bien détectée et indexée par Apache.
Initialement créé pour fonctionner sous Windows, il est également utilisable sous Linux, notamment Ubuntu grâce à Wine et surtout, il est gratuit.
Concrètement, on clique File > Check URL et on entre l’adresse du site à vérifier. On accordera une attention particulière à la partie inférieure qui permet d’exclure certaines URLs du test. En effet, le crawler est – par défaut – conçu pour vérifier toutes les URLs possibles. On pensera donc à exclure du test les liens types www.monsite.com/moncms/include et tous ce qui appartient à la construction du site Web.
On pensera également à affiner les options. Dans la configuration par défaut, le robot va traiter 30 liens à la fois. On peut augmenter le nombre de liens à analyser mais cela risque d’être analyser comme une attaque par le système à analyser. Si on décide de garder toutes les options pré-cochées, il faut également s’attendre à ce que cela prenne du temps. En effet, ici, le test a dépassé les 4h de traitement. Enfin, sauf si cela est indispensable, il vaut mieux décocher l’option de vérification des certificats. Si le robot n’arrive à analyser le certificat de sécurité, il arrête son analyse, ce qui oblige l’utilisateur à rester non seulement devant sa machine mais aussi devant le logiciel à proprement parler, pour surveiller ce qui se passe.
Autre avantage, il peut vérifier les sites sur lesquels on travaille localement, ce qui évite de perdre du temps.
Une fois l’analyse terminée, on obtient un rapport assez détaillé que l’on peut affiner comme le souhaite.
On peut exporter ce rapport et on peut également stopper une analyse pour l’enregistrer et la reprendre plus tard. De la même façon, on peut le laisser tourner dans un coin de sa machine et lui demander une notification par email une fois que le travail est terminé.
Concernant les emails, on peut les inclure ou les exclure de l’analyse. Dans mon cas, j’avais choisi de les inclure, ce qui a donné un résultat relativement cocasse sur l’une des fausses adresses email présentes sur le site. En l’espèce, il vérifie non pas l’existence de l’adresse mais plutôt la façon dont elle est construite.
En résumé, un outil de vérification relativement pratique et qui peut être – pourquoi pas – utilisé pour identifier d’éventuelles connexions entre sites Internet.