Google Image ne respecte pas mon robots.txt

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

christophebe
WRInaute impliqué
WRInaute impliqué
 
Messages: 479
Inscription: Lun Nov 24, 2003 20:48

Google Image ne respecte pas mon robots.txt

Message le Mar Juil 11, 2006 13:01

Salut,

Je viens de constater que depuis la dernière mise à jour de Google Images j'ai des images d'un site qui sont présentes dans l'index.

J'ai un robots.txt qui contient :

User-agent: *
Disallow: /images/
Disallow: /img-aff/
Disallow:
User-agent: Yahoo-MMCrawler
Disallow: /
User-agent: psbotDisallow:
Disallow: /
User-Agent: Googlebot-Image
Disallow: /

Toutes les images en question sont dans le dossier "images" que j'interdit à tous les robots et en plus j'ai mis " User-Agent: Googlebot-Image
Disallow: / " spécifiquement pour Googlebot-Image.

Mon fichier robots.txt est présent depuis le lancement du site.

Le panneau de gestion de Google Sitemap indique bien que Googlebot-Image est Bloquée par ligne 10.

J'ai fait une erreur quelque part ??

Merci.

christophebe
WRInaute impliqué
WRInaute impliqué
 
Messages: 479
Inscription: Lun Nov 24, 2003 20:48

Message le Mar Juil 11, 2006 13:33

Je m'auto-corrige.

J'ai utilisé la procédure pour supprimer du contenu de Google et il semble qu'il n'aime pas la quatrième ligne de mon robots.txt (qui est d'ailleurs inutile)

Toutefois je ne pense pas que le problème vienne de là car j'ai cette "erreur" sur tous mes sites et les autres n'ont pas d'images indexées.

PS : Google a rajouté des fonctions pour la suppression d'images (http://www.google.be/support/webmasters ... swer=35308) j'ai donc ajouté ceci à mes robots.txt :

User-agent: *
Disallow: /*.gif$
User-agent: *
Disallow: /*.jpg$


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2659
Inscription: Lun Mai 03, 2004 14:48

Re: Google Image ne respecte pas mon robots.txt

Message le Mar Juil 11, 2006 13:54

christophebe a écrit:J'ai fait une erreur quelque part ??
Oui ! :wink:

Il y a plusieurs erreurs dans tes robots.txt :

- un user-agent déterminé ne devrait apparaître qu'une seule fois et être directement suivi par les Disallow: qui le concernent.

- User-agent: et Disallow: ne peuvent pas se trouver sur la même ligne.

- il est obligatoire de mettre une ligne vide entre des séries de directives successives concernant des user-agents différents.

- les directives concernant un user-agent ne peuvent pas se contredire.
Disallow: /machin, suivi de Disallow: n'est pas acceptable.

Le robots.txt de ton premier message devrait être comme ceci :
Code: Tout sélectionner
User-agent: *
Disallow: /images/
Disallow: /img-aff/

User-agent: Yahoo-MMCrawler
Disallow: /

User-agent: psbot
Disallow: /

User-Agent: Googlebot-Image
Disallow: /


Jean-Luc

P.S. le support des "*" et "$" par Google n'est pas conforme à la norme robots.txt. Il vaudrait mieux en limiter l'utilisation aux directives destinées uniquement aux robots de Google.

christophebe
WRInaute impliqué
WRInaute impliqué
 
Messages: 479
Inscription: Lun Nov 24, 2003 20:48

Re: Google Image ne respecte pas mon robots.txt

Message le Mar Juil 11, 2006 14:49

Merci pour les infos.

J'ai les yeux dessus et je n'avais même pas vu que j'avais inventé un nouveau crawler psbotDisallow: !!

Pour les nouvelles directives de Google tu as certainement raison mieux vaut les limiter à son crawler.

Ceci est-il bon ?

User-Agent: Googlebot-Image
Disallow: /
Disallow: /*.gif$
Disallow: /*.jpg$

Je sais que cela fait double (ou triple) emploi mais bon mieux vaut prévenir que guérir...


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2659
Inscription: Lun Mai 03, 2004 14:48

Message le Mar Juil 11, 2006 16:02

C'est bon. Si Googlebot-Image ne comprend pas qu'il n'est pas le bienvenu après ça, je ne sais pas ce qu'il faut faire ! :lol:

Jean-Luc

christophebe
WRInaute impliqué
WRInaute impliqué
 
Messages: 479
Inscription: Lun Nov 24, 2003 20:48

Message le Mar Juil 11, 2006 18:42

Effectivement.

Merci pour les tips !


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités