Google Image ne respecte pas mon robots.txt
6 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
- christophebe
- WRInaute impliqué

- Messages: 479
- Inscription: Lun Nov 24, 2003 20:48
Google Image ne respecte pas mon robots.txt
Salut,
Je viens de constater que depuis la dernière mise à jour de Google Images j'ai des images d'un site qui sont présentes dans l'index.
J'ai un robots.txt qui contient :
User-agent: *
Disallow: /images/
Disallow: /img-aff/
Disallow:
User-agent: Yahoo-MMCrawler
Disallow: /
User-agent: psbotDisallow:
Disallow: /
User-Agent: Googlebot-Image
Disallow: /
Toutes les images en question sont dans le dossier "images" que j'interdit à tous les robots et en plus j'ai mis " User-Agent: Googlebot-Image
Disallow: / " spécifiquement pour Googlebot-Image.
Mon fichier robots.txt est présent depuis le lancement du site.
Le panneau de gestion de Google Sitemap indique bien que Googlebot-Image est Bloquée par ligne 10.
J'ai fait une erreur quelque part ??
Merci.
Je viens de constater que depuis la dernière mise à jour de Google Images j'ai des images d'un site qui sont présentes dans l'index.
J'ai un robots.txt qui contient :
User-agent: *
Disallow: /images/
Disallow: /img-aff/
Disallow:
User-agent: Yahoo-MMCrawler
Disallow: /
User-agent: psbotDisallow:
Disallow: /
User-Agent: Googlebot-Image
Disallow: /
Toutes les images en question sont dans le dossier "images" que j'interdit à tous les robots et en plus j'ai mis " User-Agent: Googlebot-Image
Disallow: / " spécifiquement pour Googlebot-Image.
Mon fichier robots.txt est présent depuis le lancement du site.
Le panneau de gestion de Google Sitemap indique bien que Googlebot-Image est Bloquée par ligne 10.
J'ai fait une erreur quelque part ??
Merci.
- christophebe
- WRInaute impliqué

- Messages: 479
- Inscription: Lun Nov 24, 2003 20:48
Je m'auto-corrige.
J'ai utilisé la procédure pour supprimer du contenu de Google et il semble qu'il n'aime pas la quatrième ligne de mon robots.txt (qui est d'ailleurs inutile)
Toutefois je ne pense pas que le problème vienne de là car j'ai cette "erreur" sur tous mes sites et les autres n'ont pas d'images indexées.
PS : Google a rajouté des fonctions pour la suppression d'images (http://www.google.be/support/webmasters ... swer=35308) j'ai donc ajouté ceci à mes robots.txt :
User-agent: *
Disallow: /*.gif$
User-agent: *
Disallow: /*.jpg$
J'ai utilisé la procédure pour supprimer du contenu de Google et il semble qu'il n'aime pas la quatrième ligne de mon robots.txt (qui est d'ailleurs inutile)
Toutefois je ne pense pas que le problème vienne de là car j'ai cette "erreur" sur tous mes sites et les autres n'ont pas d'images indexées.
PS : Google a rajouté des fonctions pour la suppression d'images (http://www.google.be/support/webmasters ... swer=35308) j'ai donc ajouté ceci à mes robots.txt :
User-agent: *
Disallow: /*.gif$
User-agent: *
Disallow: /*.jpg$
Re: Google Image ne respecte pas mon robots.txt
Oui !christophebe a écrit:J'ai fait une erreur quelque part ??
Il y a plusieurs erreurs dans tes robots.txt :
- un user-agent déterminé ne devrait apparaître qu'une seule fois et être directement suivi par les Disallow: qui le concernent.
- User-agent: et Disallow: ne peuvent pas se trouver sur la même ligne.
- il est obligatoire de mettre une ligne vide entre des séries de directives successives concernant des user-agents différents.
- les directives concernant un user-agent ne peuvent pas se contredire.
Disallow: /machin, suivi de Disallow: n'est pas acceptable.
Le robots.txt de ton premier message devrait être comme ceci :
- Code: Tout sélectionner
User-agent: *
Disallow: /images/
Disallow: /img-aff/
User-agent: Yahoo-MMCrawler
Disallow: /
User-agent: psbot
Disallow: /
User-Agent: Googlebot-Image
Disallow: /
Jean-Luc
P.S. le support des "*" et "$" par Google n'est pas conforme à la norme robots.txt. Il vaudrait mieux en limiter l'utilisation aux directives destinées uniquement aux robots de Google.
- christophebe
- WRInaute impliqué

- Messages: 479
- Inscription: Lun Nov 24, 2003 20:48
Re: Google Image ne respecte pas mon robots.txt
Merci pour les infos.
J'ai les yeux dessus et je n'avais même pas vu que j'avais inventé un nouveau crawler psbotDisallow: !!
Pour les nouvelles directives de Google tu as certainement raison mieux vaut les limiter à son crawler.
Ceci est-il bon ?
User-Agent: Googlebot-Image
Disallow: /
Disallow: /*.gif$
Disallow: /*.jpg$
Je sais que cela fait double (ou triple) emploi mais bon mieux vaut prévenir que guérir...
J'ai les yeux dessus et je n'avais même pas vu que j'avais inventé un nouveau crawler psbotDisallow: !!
Pour les nouvelles directives de Google tu as certainement raison mieux vaut les limiter à son crawler.
Ceci est-il bon ?
User-Agent: Googlebot-Image
Disallow: /
Disallow: /*.gif$
Disallow: /*.jpg$
Je sais que cela fait double (ou triple) emploi mais bon mieux vaut prévenir que guérir...
- christophebe
- WRInaute impliqué

- Messages: 479
- Inscription: Lun Nov 24, 2003 20:48
Effectivement.
Merci pour les tips !
Merci pour les tips !
6 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Alexa lance un moteur de recherche d'images
- Sortie de GoogleStats v2.01
- Les crawlers de Yahoo!
- Les robots MSNbot de Live Search
- La terre vue par satellite : accord entre Google et Spot Image
- Lancement de Spider Simulator
- Googlebot, le robot d'indexation de Google
- Déclarer son fichier sitemap dans le fichier robots.txt
- Petit changement pour Slurp (le robot de Yahoo)
- Ajouter un moteur de recherche d'images sur son site
Consultez la description détaillée des produits ou services de Google suivants : Google Image Labeler
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités



le forum