supprimer url de google

supprimer url de google

mercredi 3 janvier 2007, par fanny

supprimer url de google

Comment retirer un contenu de l’index de Google ?

Si vous avez un besoin urgent de supprimer vos pages de google pour éviter un duplicate content par exemple car vous venez de basculer votre site sur une autre url, voici les recommandation de Matt Cuts en vidéo :

Supprimer url de google, désindexer son site

En fait, d’après ce qu’il dit, le mieux pour désindexer son site de google est d’une part un fichier .htaccess pour les visiteurs et d’autre part d’utiliser webmaster tool, où vous avez la possibilité de supprimer un site entier, une page, un répertoire au choix. C’est beaucoup plus rapide et efficace qu’avant.

L’url pour désindexer votre site :

https://www.google.com/webmasters/tools/ ensuite vous cliquez sur votre site, puis sur tool, puis sur remove url et vous choisissez votre url à supprimer ou site ou dossier.

Pour accéder à cet outil, vous devez déjà posséder un compte google, ensuite ajouter votre site, votre sitemap sinon l’outil remove url ne sera pas actif si vous ajoutez juste votre site sans avoir ajouté de sitemap et procédé à la vérification du site.

Les recommandations sur le site de google :

Les modifications entreront en vigueur la prochaine fois que Google crowlera votre site.

Plusieurs possibilités de desindexation :

- Enlever votre site Web entier
- Enlever une partie de votre site Web
- Enlever les extraits
- Enlever les pages cachées
- Enlever un lien périmé
- Enlever une image de la recherche d’image de Google
- Enlever un blog de la recherche de Blog
- Enlever une alimentation de RSS ou d’atome (c.-à-d., bloc Feedfetcher)
- Enlever les pages transcodées

Enlever votre site Web entier

Si vous souhaitez exclure votre site Web entier de l’index de Google, vous pouvez placer un dossier à la racine de votre serveur appelé robots.txt. C’est le protocole standard que la plupart des chercheurs Web utilisent pour exclure un web server ou un annuaire d’un index. Veuillez noter que Googlebot n’interprète pas une réponse de 401/403 (« non autorisé »/« interdit ») à robots.txt cherchent comme demande de ne pas crawler aucune page sur l’emplacement. Pour enlever votre site des moteurs de recherche et empêcher tous les robots de crawler, il faudra placer le dossier suivant de robots.txt dans votre racine de serveur :

User-agent : * Disallow : /

Pour enlever votre site de Google seulement et empêcher juste Googlebot de crawler votre site ensuite, placer le dossier suivant de robots.txt dans votre racine de serveur :

User-agent : Googlebot Disallow : /

Chaque port doit avoir son propre dossier de robots.txt. En particulier, si vous servez le contenu par l’intermédiaire du HTTP et des https, vous aurez besoin d’un dossier séparé de robots.txt pour chacun de ces protocoles.

Par exemple, pour permettre à Googlebot de classer tout le HTTP pagine mais aucunes pages de https, vous emploieriez les dossiers de robots.txt ci-dessous.

Pour votre protocole http (http://votreserveur.fr/robots.txt) :

User-agent : * Allow : /

Pour votre protocole https (https://votreserveur.fr/robots.txt) :

User-agent : * Disallow : /

Note : Si vous croyez votre demande est pressante et ne peut pas attendre jusqu’à la prochaine fois que Google crawlera votre site, vous pouvez employer le système automatique de déplacement d’URL. Afin de permettre à ce processus automatisé de travailler, le webmaster doit d’abord créer et placer un dossier de robots.txt sur l’emplacement en question. Google continuera à exclure votre emplacement ou annuaires des crawls successifs si le dossier de robots.txt existe dans la racine de web server.

Si vous n’avez pas accès au niveau de racine de votre serveur, vous pouvez placer un dossier de robots.txt au même niveau que les dossiers que vous veulez exclure. Faire ceci et la soumission par l’intermédiaire du système automatique de déplacement d’URL causeront un provisoire déplacement de 180 jours de votre emplacement de l’index de Google, indépendamment du fait d’enlevez le dossier de robots.txt après traitement de votre demande. (Garder le dossier de robots.txt au même niveau exigerait de retourner au système de déplacement d’URL tous les 180 jours pour réviser le déplacement.)




Articles de cette rubrique
  • sitelinks google liste de liens
    sitelinks ou la liste de liens sur google c’est l’affichage de plusieurs page d’un site en première position qui ressemble à ça (...)
  • flux rss msn
    Outils de recherche de flux rss sur msn Live Search.
  • Les commandes site et link de google
    Commande site de google, pour connaitre le nombre de pages indexées sur google.
  • indexation dans msn
    Soumission d’url dans msn Pour suggérer l’url de votre site dans le moteur de recherche msn, voici le lien direct : (...)
  • commande site pour msn
    La commande site sur msn vous permet de connaître le nombre de page de votre site indexées par msn. Tapez ceci dans le moteur de recherche msn (...)
  • pages indexees dans google
    Commande site de Google Pour connaître le nombre de page de son site indexées par Google, voici la commande à faire : tapez dans google (...)
  • supprimer url de google
    Comment retirer un contenu de l’index de Google ? Si vous avez un besoin urgent de supprimer vos pages de google pour éviter un duplicate (...)
  • La commande link de google
    Pour connaitre le nombre liens vers votre site sur google, utilisez la commande link de Google. Tapez ceci dans google : (...)
  • visites de google
    Recenser la fréquence des passages de google sur son site avec un petit script en php à installer sur vos pages. Puisque nous connaissons les IP (...)
  • inscrire votre site dans 26 moteurs de recherches d’un coup
    Pour referencer votre site dans 26 moteurs de recherche en une seule fois, cet outil très pratique de referencement. Vous n’avez que (...)