Quand Googlebot fait l'impasse à robots.txt
5 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

5_legs - WRInaute passionné

- Messages: 2072
- Inscription: 30 Avr 2006
Quand Googlebot fait l'impasse à robots.txt
Il y a des jours où il m'agace !
J'ai sur plusieurs sites une page pour signaler un bug, pour l'exemple on va dire :
/y-a-un-bug.php suivi d'une variable identifiante ce qui nous donne (toujours par exemple)
/y-a-un-bug.php?products_id=39
J'ai bien dans mon robots.txt un
Disallow: /y-a-un-bug.php
Et bien régulièrement il m'en indexe une, je suis obligé de demandé l'effacement dans GWT
Nan mais c'est vrai quoi ! il m'agace à ne pas faire ce que je lui demande !
J'ai sur plusieurs sites une page pour signaler un bug, pour l'exemple on va dire :
/y-a-un-bug.php suivi d'une variable identifiante ce qui nous donne (toujours par exemple)
/y-a-un-bug.php?products_id=39
J'ai bien dans mon robots.txt un
Disallow: /y-a-un-bug.php
Et bien régulièrement il m'en indexe une, je suis obligé de demandé l'effacement dans GWT
Nan mais c'est vrai quoi ! il m'agace à ne pas faire ce que je lui demande !
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Re: Quand Googlebot fait l'impasse à robots.txt
Si tu parles du site de ton www, des /signaler_bug.php sont dans l'index, mais sans cache, ce qui veut dire que Google a bien respecté le robots.txt puisqu'il ne les a pas crawlées.
Si tu tiens à interdire toute indexation de ces pages, il faut :
- soit mettre des rel="nofollow" sur tous les liens vers ces pages;
- soit laisser Google les crawler (donc enlever l'interdiction du robots.txt) et mettre une meta robots noindex dans la page même.
Jean-Luc
Si tu tiens à interdire toute indexation de ces pages, il faut :
- soit mettre des rel="nofollow" sur tous les liens vers ces pages;
- soit laisser Google les crawler (donc enlever l'interdiction du robots.txt) et mettre une meta robots noindex dans la page même.
Jean-Luc
-

5_legs - WRInaute passionné

- Messages: 2072
- Inscription: 30 Avr 2006
Re: Quand Googlebot fait l'impasse à robots.txt
jeanluc a écrit:Si tu parles du site de ton www, des /signaler_bug.php sont dans l'index, mais sans cache, ce qui veut dire que Google a bien respecté le robots.txt puisqu'il ne les a pas crawlées.
Si tu tiens à interdire toute indexation de ces pages, il faut :
- soit mettre des rel="nofollow" sur tous les liens vers ces pages;
- soit laisser Google les crawler (donc enlever l'interdiction du robots.txt) et mettre une meta robots noindex dans la page même.
Jean-Luc
Bonsoir Jean-Luc, merci pour ta réponse
Mais les liens sont bien en nofollow
Ensuite si ces pages sont dans l'index c'est bien qu'elles ont été crawlées. non ? suis perdu là
Et dans ce cas pourquoi seulement une et pas toutes ?
En fait je ne voulais tout simplement pas les voir dans l'index.
Ceci dit ce n'est pas grave en soit, c'est juste que je ne comprends pas
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Re: Quand Googlebot fait l'impasse à robots.txt
Pas nécessairement ! L'algo de Google repose en grande partie sur la réputation des pages (PageRank, link juice, TrustRank et compagnie). Une page peut avoir une bonne réputation avant d'avoir été visitée par le robot, mais c'est évidemment l'exception. Dans ton cas, il se peut que la page soit présente seulement quand tu fais site: et qu'elle ne sorte jamais sur une requête "normale".druart a écrit:Ensuite si ces pages sont dans l'index c'est bien qu'elles ont été crawlées. non ?
La méthode la plus fiable pour qu'une page n'apparaisse pas dans Google, c'est :
- laisser Googlebot visiter la page (donc pas d'interdiction dans robots.txt)
- et mettre une meta robots noindex dans la page même.
Ainsi Googlebot visitera la page et il y verra que tu ne veux pas qu'elle soit indexée.
En résumé :
- robots.txt interdit seulement le crawl (et rend ainsi peu probable l'indexation, mais ne l'interdit pas)
- meta robots noindex interdit l'indexation (mais il faut que le crawl soit autorisé)
Jean-Luc
5 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Googlebot interprete window.location.href depuis quand ?
- Impasse pour le positionnement d'un site
- Impasse besoin d'avis d'expert référencement.
- robots.txt et Googlebot-Image
- Visites googlebot, robots.txt et nb de hits
- Adresses IP et noms des robots GoogleBot
- Pb GoogleBot et erreur 403 sur robots.txt
- robots.txt pour Googlebot Image [réglé]
- Fichier Robots pas suivi par GoogleBot
- Googlebot ne semble voir que mon robots.txt, normal?
Consultez la description détaillée des produits ou services de Google suivants : Googlebot
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
