Le spam analytics
Surveiller ses logs, c’est bien mais regarder ce qui se passe du côté de ses statistiques de fréquentation, c’est mieux. En faisant un tour sur mon Google Analytics, j’ai eu l’immense surprise de voir ceci dans la catégorie langue :
En faisant une recherche rapide, j’ai découvert qu’il s’agissait d’une variété de spam : le spam analytics.
Le spam analytics : pourquoi ?
Cette technique, que je classe dans la section Black SEO, peut aussi – comme le spam traditionnel – être vectrice de malware. Dans le cas illustré ici, il s’agissait surtout d’une campagne électorale. L’idée générale est de pourrir les rapports analytics des webmasters, community managers, développeurs, etc. pour les inciter à visiter des sites et voir dans quel contexte on parle de leur application Web. Il peut aussi s’agir de générer du trafic vers ses sites. En effet, certains portails laissent publics leurs backlinks et leurs référents, améliorant du même coup les backlinks-spammeurs et donc leur notoriété et donc leur rang dans les résultats de recherche. C’est ce qu’on appelle du spamindexing.
En résumé, le spam analytics sert à :
- Générer un faux trafic ;
- Propager des malwares ;
- Faire grimper sa propre notoriété.
On a vu le pourquoi, passons au comment.
Comment fonctionne le spam analytics ?
En matière de spam analytics, il y a deux techniques :
- Le bot Referral Spam ;
- Le Ghost Referral Spam.
Comme son nom l’indique, le premier est un robot qui va effectivement visiter votre site, donc générer du trafic. Cette technique est simple et tout le monde sait le faire. Le second est un peu plus vicieux car il ne concerne que les sites fonctionnant avec Google Analytics, il ne visite pas votre site mais il laisse quand même une empreinte dans vos statistiques, soit par faux référents, par faux langages ou par faux mots-clefs.
Mais alors, comment peut-on polluer des statistiques en ne visitant pas un site Web ? En utilisant une petite « faille » de Google Analytics, qui en réalité une fonctionnalité, faisant ainsi une démonstration remarquable de la phrase « it’s not a bug, it’s a feature ». On commence par générer des codes Google Analytics. On envoie ensuite de fausses données grâce au protocole de mesure de Google Analytics et ces fausses données sont ensuite enregistrées dans les statistiques des comptes ciblés. Le protocole de mesures de Google Analytics autorise les développeurs à faire des requêtes HTTP afin que ces derniers puissent mesurer des interactions.
Dernier point : comment s’en débarrasser ?
Supprimer le spam analytics
La solution la plus simple et la plus radicale est encore de supprimer son compte Google Analytics et éventuellement de passer à Piwik. Mais on va partir du principe que vous souhaitez rester sur Google Analytics.
Pour les bots referral Spam, vous pouvez personnaliser votre .htaccess. Si vous ne vous sentez pas à l’aise de le faire, même avec un générateur en ligne, vous pouvez tout simplement appliquer des filtres ou des segments dans vos rapports afin que les bots et les ghosts ne soient plus pris en compte.
Dernier point strictement légal : à proprement parler, comme je l’ai déjà indiqué, l’utilisation de techniques de Black SEO n’est pas illégale. Néanmoins, si elles sont utilisées pour propager des malwares, évidemment, on tombe dans du pénal. Enfin, s’il venait à l’esprit de certaines personnes de se servir de ce type de plaisanterie à des fins électorales, cela serait assimilé à de la fraude électorale. A bon entendeur.