Bloquer les faux sites référents dans vos statistiques analytics

Catégorie: Hébergement (Mis à jour le 30-05-2015 21:43:01)

Les référents (referer en anglais) désignent une page qui envoie des visiteurs sur votre site. Mais certains s'en servent comme technique de promotion.

Vous avez des sites référents bizarres qui polluent vos statistiques analytics? Ces référents sont en fait des bots qui spamment votre site en utilisant l'url d'un autre site comme référent. Ces visites apparaissent donc dans vos statistiques mais il ne s'agit pas d'une vrai visite. Certains bots ne chargent même pas votre page!

L'inconvénient pour nous est surtout que ces visiteurs inexistants polluent nos statistiques et pompent notre bande passante pour rien.

Dans la suite de l'article, je vais vous expliquer à quoi sert cette opération pour leurs auteurs et comment en limiter l'impact!

A quoi servent ces spams ?

Pour contrer un problème, il faut d'abord comprendre pourquoi il existe. Le spam par référent (referer) est une technique SEO dite black hat (illégale) qui vise, en spammant les statistiques de sites légitimes, à faire venir le webmaster du site touché sur leur url.

Sachez donc que si, par curiosité, vous avez tapé l'url de ces référents dans votre navigateur, alors vous leur avez déjà permis de remplir leur objectif (Pour cette fois en tout cas).

En revanche pas d'inquiétude, cette technique est totalement innofensive. Il n'y a aucun risque de sécurité à laisser ces visites tel quel. Personnellement j'ai décidé de les bloquer par principe mais le choix vous appartient.

Comment les bloquer ?

Pour les bloquer, rien de plus simple et tout le code est déjà fait! Vous pouvez soit bloquer leur affichage dans google analytics, soit bloquer l'accès à votre serveur pour ces clients. Un plugin wordpress est même disponible!

Bloquer dans google analytics

Dans la section administration de votre compte analytics. Il existe une section filtres. Il suffit d'ajouter un (ou des) filtres permettant d'éliminer les visites indésirables en fonction du champ Site référent. Le problème de cette technique est que le nombre de filtres est difficile à gérer (et une limite est imposée par google).

Bloquer au niveau du serveur

Pour ceux qui utilisent apache, voici un extrait du fichier htaccess de mon site pour bloquer ces spammeurs:

# Block visitors with fake referers
SetEnvIfNoCase Via pinappleproxy spammer=yes
SetEnvIfNoCase Referer semalt.com spammer=yes
SetEnvIfNoCase Referer poker spammer=yes
SetEnvIfNoCase Referer 4webmasters.org spammer=yes
SetEnvIfNoCase Referer best-seo-solution.com spammer=yes
SetEnvIfNoCase Referer buttons-for-website.com spammer=yes
SetEnvIfNoCase Referer buttons-for-your-website.com spammer=yes
SetEnvIfNoCase Referer 4webmasters.org spammer=yes
SetEnvIfNoCase Referer best-seo-offer.com spammer=yes

Order allow,deny
Allow from all
Deny from env=spammer

Personnellement je conseille d'ajouter les sites à cette liste au fur et à mesure qu'ils apparaissent dans vos stats.

Bloquer dans wordpress

Il existe des plugins Wordpress pour bloquer ce genre de pratique.

A lire aussi:

Comparaison et avis sur les hébergements PHP gratuits

[Hébergement] Developper son site c'est bien, mais il ne sert à rien sur votre disque dur. Voici une liste qui vous permettra de choisir le meilleur hebergement gratuit pour votre production.
Suite...

Generer et deployer automatiquement de la documentation grâce à wercker

[Hébergement] Un gros projet améne forcément ses besoins en documentation. Cet article montre comment utiliser un service d'intégration continue gratuit pour déployer automatiquement la documentation asociée.
Suite...