Accueil > referencement > sandbox blacklistage

sandbox blacklistage

mercredi 27 septembre 2006

sandbox

blacklistage

ARTICLE REDIGE PAR RANKSPIRIT (voir le lien à la fin de l’article)

Mais qu’est-ce-que le bac-à-sable (sandbox)

Le bac-à-sable est une "punition" infligée par Google (et seulement ce moteur, semble-t-il), aux sites qui ont usé de techniques "malhonnêtes" pour tenter de gagner des positions dans les résultats des recherches.

Cette "punition" peut s’appliquer à l’ensemble du site et à tous les termes que ces pages contiennent. Elle serait provoquée par des abus en relation avec le pagerank.

Elle peut aussi être strictement spécifique à un mot ou à une expression dont le site a fait une "promotion" un peu trop appuyée (répétition excessive, par exemple). Elle serait alors provoquée par des abus en relation avec la pertinence.

Certains supposent que les sites récents seraient systématiquement placés dans la "sandbox", qui serait ainsi une sorte de purgatoire en attendant que ces sites aient fait leurs preuves. Le nombre de contre-exemples est si nombreux que nous doutons très fortement de cette théorie. Les sites récents et "sur-optimisés" sont sans doute - par contre - plus susceptibles de tomber dans la sandbox.

Quoi qu’il en soit, la conséquence est une reculade brutale de la position du site concerné (voir une disparition totale) dans les résultats de Google. Cet effet peut avoir une durée de 4 à 30 semaines (sans que l’on sache exactement pourquoi) et peut même perdurer d’avantage si le site concerné continue à user de stratagèmes "interdits".

Chacun a sa théorie sur le sens à donner à ce système de pénalité. On peut supposer qu’il vise à compliquer l’exploration des "limites" de Google. Accepte-t-il 30 ,40, 50 ou 100 répétitions d’un terme avant de faire tomber le couperet ? Seuls des essais successifs pourraient nous l’apprendre !

En jetant votre site dans le bac-à-sable, Google vous empêche de refaire une tentative d’abus (ou plutôt, il vous empêche d’en mesurer les effets) pendant plusieurs semaines. Mais puisque les règles qui régissent les comportements de Google varient régulièrement, il devient impossible de tirer des conclusions fiables sur ce qui est est licite ou illicite à moins d’être prêt à sacrifier plusieurs sites pour de nombreuses semaines.

Une autre explication, plus simple, consiste à penser que Google cherche tout simplement à "dégoûter" les webmasters qui se livrent à des pratiques douteuses. Dépensez votre temps à améliorer la qualité, pas à chercher des combines, est bien le message que nous répètent inlassablement GoogleGuy et son successeur Matt Cutt.

DANS LE DOUTE, ABSTIENS-TOI !!!!!!!

C’est bien la politique à laquelle les webmasters doivent adhérer ! En travaillant (presque) exclusivement sur l’intérêt de votre site pour ses visiteurs, en vous souciant de son confort de navigation, de sa clarté et de sa cohérence, vous rejoindrez les objectifs des moteurs : satisfaire les internautes. Et vous avez toutes les chances d’obtenir une bonne note globale de leur part !

Que faut-il éviter ?

Nous n’avons pas la liste exhaustive des raisons pour lesquelles vous pourriez vous retrouvez dans le bas-à-sable. En voici toute de même quelques-unes qui ont fait leurs preuves :

Répéter un mot ou une expression un trop grand nombre de fois. Quelle que soit la zone (balises "meta", Alt, texte,...) ou la répétition à lieu. Les répétitions à l’intérieur du texte semblent toutefois bien tolérées lorsque le mot ou l’expression sont mélangés à du texte non répétitif (en clair, lorsqu’ils sont utilisés d’une manière normale !)

Faire figurer du texte d’une couleur identique au fond (blanc sur blanc, noir sur noir, etc.). Cette technique est utilisée pour ajouter à la page, du texte non visible par les internautes, mais reconnu par les moteurs. Certains pensent que cette technique n’est pas une cause de bac-à-sable mais que Google attribue aux expressions une pertinence proportionnelle à leur contraste par rapport au fond. Dans tous les cas : prudence !

Faire une "farm-link" sur son site. Les "farm-links" sont des pages uniquement constituées d’un grand nombre de liens vers d’autres sites qui comportent des pages du même genre. Le but étant d’utiliser d’une manière intensive l’échange de liens pour tenter de gagner du pagerank.

Créer un site avec une énorme quantité de liens pointant vers lui dès sa naissance. Une théorie assez crédible de Benjamin Tolman soutient que Google pénaliserait les sites ayant une "croissance" suspecte. Il est clair que Google doit avoir trouvé une tactique pour décourager la vente et l’achat de "backlinks" (des liens appartenant à un site de pagerank élevé et pointant vers le site à promouvoir). Cette pratique fausse en effet complètement l’esprit du web et nuit à la fiabilité des résultats des recherches.

* Mettre en place un Google-bombing au profit de son site. Si votre site est optimisé pour le mot "machin" et que plusieurs centaine de sites pointent vers le votre avec le mot "machin" dans le texte de leurs liens, Google risque de sentir l’arnaque. Les liens qui pointent vers votre site doivent absolument avoir des textes variés. Méfiez-vous donc des référencements automatiques qui vous font courir ce risque.

* Faire un site de 1000 pages, dont 999 pages vides et orphelines (ou pleines de textes bidon) qui pointent vers une seule page ayant du contenu. Si vous avez attentivement lu notre page parlant du pagerank, vous comprendrez que ce type de construction peut permettre de gonfler artificiellement le pagerank d’une page. Google, pas si fou, risque de ne pas apprécier la manoeuvre. D’une manière générale, toutes les sortes de pages satellites sont dangereuses.

* Avoir des liens qui pointent vers des sites "malhonnêtes". (Dis-moi qui tu fréquentes et je te dirais qui tu es). C’est l’un des côté un peu "Big Brother" de Google qui se permet de vous juger en fonction de vos liens sortants. Si vous avez une vrai bonne raison de faire figurer ce type de lien, ajoutez l’argument

* rel="nofollow" dans vos liens. Pour plus d’information sur ce point, lire notre article sur le "Trustrank"

*Pratiquer le cloaking malhonnête ou l’une de ses variantes.

Voici la liste des pratiques officiellement déconseillées par Google :
(texte extrait de la page http://www.google.fr/support/webmasters/bin/answer.py?answer=35769)

Généralités :

  • Concevez vos pages pour les utilisateurs, et non pour les moteurs de recherche. Ne trompez pas les utilisateurs en affichant un contenu pour les moteurs de recherche différent de celui qui leur est présenté (technique appelée "cloaking" ou masquage).

  • Évitez les "astuces" destinées à améliorer le classement de votre site par les moteurs de recherche. Vous devriez en principe pouvoir expliquer en toute sérénité à un site Web concurrent les solutions que vous avez adoptées. Vous pouvez également vous poser les questions suivantes : ces solutions sont-elles une aide pour les utilisateurs ? Aurions-nous fait appel à ces techniques si les moteurs de recherche n’existaient pas ?

  • Ne participez pas à des systèmes de liens conçus pour améliorer artificiellement le classement PageRank de votre site. Évitez tout particulièrement les liens vers les polluposteurs ou les "voisinages douteux" sur le Web, car ces liens risqueraient d’avoir une incidence négative sur le classement de votre site.

  • N’utilisez pas de programmes non agréés pour demander l’indexation de vos pages, vérifier votre classement, etc. Ces programmes consomment des ressources informatiques inutilement et constituent généralement une infraction à nos conditions d’utilisation . Google déconseille l’emploi de produits tels que WebPosition Gold™, qui envoient des requêtes automatiques ou programmées à Google.

Conseils précis

  • Évitez le texte ou les liens cachés.

  • N’utilisez pas de pages masquées ("cloaking") ou de redirections trompeuses.

  • N’envoyez pas de requêtes automatiques à Google.

  • Ne multipliez pas les termes sans rapport avec le contenu réel de votre site.

  • Ne créez pas plusieurs pages, sous-domaines ou domaines présentant un contenu en grande partie identique.

  • Veillez à créer des pages ne permettant pas l’installation de virus, de chevaux de Troie ou de tout autre programme mouchard ("badware") .

  • Évitez les pages satellites ("doorway") créées exclusivement pour les moteurs de recherche ou d’autres solutions telles que les programmes d’affiliation sans véritable contenu informatif.

  • Si votre site fait partie d’un programme d’affiliation, assurez-vous qu’il est utile aux utilisateurs. Présentez un contenu pertinent et original pour inciter les internautes à visiter votre site en premier.

Si un site ne répond pas à nos conseils en matière de qualité, son inclusion dans notre index peut-être bloquée . Si vous pensez que votre site ne respecte pas ces conseils, vous pouvez le modifier et le rendre conforme. Ensuite, vous pouvez faire une demande de réintégration .

 

"Sandboxé" ou "blacklisté" ?

Le terme de "sandboxage" est généralement utilisé lorsqu’un site semble avoir été pénalisé sur certains termes ou pour certaines de ses pages.

Lorsqu’un site est purement et simplement retiré de l’index et qu’il n’est plus possible de la faire apparaître dans les résultats de recherche (même en faisant une recherche sur son nom de domaine), on parle plutôt de "blacklistage" (mot issu de "black list", qui signifie "liste noire").

Comment savoir si mon site est "sandboxé" ?

Les filtres assimilés à la "sandbox" ont un comportement suffisamment simpliste pour qu’il soit assez facile de les mettre en évidence. Voici plusieurs techniques qui permettent de constater qu’un filtre de pénalisation est en place :

Faire une recherche avec un accent : si les résultats d’une recherche sur le mot "hûmour" sont différents de ceux de la recherche sur le mot "humour", c’est que certains filtres les ont modifiés.
allintextFaire une recherche avec allintext : à quelques rares exceptions près, cette recherche devrait donner les mêmes résultats que sans l’attribut allintext. Les différences peuvent être intéressantes à observer. Le texte de votre recherche devient alors : allintext:humour.
asdfAjouter une vingtaine de "-asdf" dans la requête : le texte de votre recherche sera dans ce cas : humour -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf -asdf.

* Comparer vos résultats Google et MSN  : si vous êtes en première position sur MSN et sur la 50ème page des résultats de Google, il est vous est permis de vous demander pourquoi. Cela dit, les deux moteurs utilisent des algorithmes assez différents pour expliquer certains cas de ce type sans recourir à la théorie de la "sandbox".
* Faire des recherches sur des expression composées : si vous êtes premier sur l’expression "de l’humour" et absent des résultats pour le mot "humour" (ou vice versa), c’est sans doute qu’un filtre est en jeu.

Conclusion>

Si vous êtes convaincu qu’on ne peut pas réussir en étant honnête et que les méchants triomphent toujours, prenez encore le temps de lire notre page sur le référencement et la morale.

Article original rédigé par : RankSpirit, Créez votre site Web. N’hésitez pas à consulter ce site pour y découvrir d’autres articles !

Ce qui donne :
Article original rédigé par : RankSpirit, Créez votre site Web. N’hésitez pas à consulter ce site pour y découvrir d’autres articles !

Le design et les images de ce site sont protégés par les lois sur la propriété intellectuelle et ne doivent pas être reproduits sans notre autorisation express ou celles de leurs auteurs.

Plan du site
Découvrir RankSpirit • Download

Dans la même rubrique


Contact |