Google Image ne respecte pas mon robots.txt
6 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- christophebe
- WRInaute occasionnel

- Messages: 487
- Inscription: 24 Nov 2003
Google Image ne respecte pas mon robots.txt
Salut,
Je viens de constater que depuis la dernière mise à jour de Google Images j'ai des images d'un site qui sont présentes dans l'index.
J'ai un robots.txt qui contient :
User-agent: *
Disallow: /images/
Disallow: /img-aff/
Disallow:
User-agent: Yahoo-MMCrawler
Disallow: /
User-agent: psbotDisallow:
Disallow: /
User-Agent: Googlebot-Image
Disallow: /
Toutes les images en question sont dans le dossier "images" que j'interdit à tous les robots et en plus j'ai mis " User-Agent: Googlebot-Image
Disallow: / " spécifiquement pour Googlebot-Image.
Mon fichier robots.txt est présent depuis le lancement du site.
Le panneau de gestion de Google Sitemap indique bien que Googlebot-Image est Bloquée par ligne 10.
J'ai fait une erreur quelque part ??
Merci.
Je viens de constater que depuis la dernière mise à jour de Google Images j'ai des images d'un site qui sont présentes dans l'index.
J'ai un robots.txt qui contient :
User-agent: *
Disallow: /images/
Disallow: /img-aff/
Disallow:
User-agent: Yahoo-MMCrawler
Disallow: /
User-agent: psbotDisallow:
Disallow: /
User-Agent: Googlebot-Image
Disallow: /
Toutes les images en question sont dans le dossier "images" que j'interdit à tous les robots et en plus j'ai mis " User-Agent: Googlebot-Image
Disallow: / " spécifiquement pour Googlebot-Image.
Mon fichier robots.txt est présent depuis le lancement du site.
Le panneau de gestion de Google Sitemap indique bien que Googlebot-Image est Bloquée par ligne 10.
J'ai fait une erreur quelque part ??
Merci.
- christophebe
- WRInaute occasionnel

- Messages: 487
- Inscription: 24 Nov 2003
Je m'auto-corrige.
J'ai utilisé la procédure pour supprimer du contenu de Google et il semble qu'il n'aime pas la quatrième ligne de mon robots.txt (qui est d'ailleurs inutile)
Toutefois je ne pense pas que le problème vienne de là car j'ai cette "erreur" sur tous mes sites et les autres n'ont pas d'images indexées.
PS : Google a rajouté des fonctions pour la suppression d'images (http://www.google.be/support/webmasters ... swer=35308) j'ai donc ajouté ceci à mes robots.txt :
User-agent: *
Disallow: /*.gif$
User-agent: *
Disallow: /*.jpg$
J'ai utilisé la procédure pour supprimer du contenu de Google et il semble qu'il n'aime pas la quatrième ligne de mon robots.txt (qui est d'ailleurs inutile)
Toutefois je ne pense pas que le problème vienne de là car j'ai cette "erreur" sur tous mes sites et les autres n'ont pas d'images indexées.
PS : Google a rajouté des fonctions pour la suppression d'images (http://www.google.be/support/webmasters ... swer=35308) j'ai donc ajouté ceci à mes robots.txt :
User-agent: *
Disallow: /*.gif$
User-agent: *
Disallow: /*.jpg$
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Re: Google Image ne respecte pas mon robots.txt
Oui !christophebe a écrit:J'ai fait une erreur quelque part ??
Il y a plusieurs erreurs dans tes robots.txt :
- un user-agent déterminé ne devrait apparaître qu'une seule fois et être directement suivi par les Disallow: qui le concernent.
- User-agent: et Disallow: ne peuvent pas se trouver sur la même ligne.
- il est obligatoire de mettre une ligne vide entre des séries de directives successives concernant des user-agents différents.
- les directives concernant un user-agent ne peuvent pas se contredire.
Disallow: /machin, suivi de Disallow: n'est pas acceptable.
Le robots.txt de ton premier message devrait être comme ceci :
- Code: Tout sélectionner
User-agent: *
Disallow: /images/
Disallow: /img-aff/
User-agent: Yahoo-MMCrawler
Disallow: /
User-agent: psbot
Disallow: /
User-Agent: Googlebot-Image
Disallow: /
Jean-Luc
P.S. le support des "*" et "$" par Google n'est pas conforme à la norme robots.txt. Il vaudrait mieux en limiter l'utilisation aux directives destinées uniquement aux robots de Google.
- christophebe
- WRInaute occasionnel

- Messages: 487
- Inscription: 24 Nov 2003
Re: Google Image ne respecte pas mon robots.txt
Merci pour les infos.
J'ai les yeux dessus et je n'avais même pas vu que j'avais inventé un nouveau crawler psbotDisallow: !!
Pour les nouvelles directives de Google tu as certainement raison mieux vaut les limiter à son crawler.
Ceci est-il bon ?
User-Agent: Googlebot-Image
Disallow: /
Disallow: /*.gif$
Disallow: /*.jpg$
Je sais que cela fait double (ou triple) emploi mais bon mieux vaut prévenir que guérir...
J'ai les yeux dessus et je n'avais même pas vu que j'avais inventé un nouveau crawler psbotDisallow: !!
Pour les nouvelles directives de Google tu as certainement raison mieux vaut les limiter à son crawler.
Ceci est-il bon ?
User-Agent: Googlebot-Image
Disallow: /
Disallow: /*.gif$
Disallow: /*.jpg$
Je sais que cela fait double (ou triple) emploi mais bon mieux vaut prévenir que guérir...
- christophebe
- WRInaute occasionnel

- Messages: 487
- Inscription: 24 Nov 2003
Effectivement.
Merci pour les tips !
Merci pour les tips !
6 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Google ne respecte pas mon robots.txt!!!!
- Google ne respecte pas les robots.txt ?
- Google image vs Robots.txt
- Google respecte les copyrights!
- robots.txt et Googlebot-Image
- google ne respecte pas noindex et les consignes du robot.txt
- robots.txt pour Googlebot Image [réglé]
- référencement image filtré par SafeSearch dans google image
- image de notre site sur google image + autres questions
- Référencer une image dans google image
- Alexa lance un moteur de recherche d'images - 18-12-2006
- Sortie de GoogleStats v2.01 - 02-03-2003
- Les crawlers de Yahoo! - 18-03-2004
- Les robots MSNbot de Live Search - 30-11-2006
- Googlebot, le robot d'indexation de Google - 21-02-2003
- Déclarer son fichier sitemap dans le fichier robots.txt - 16-04-2007
- Lancement de Spider Simulator - 13-06-2004
- Petit changement pour Slurp (le robot de Yahoo) - 29-03-2007
Consultez la description détaillée des produits ou services de Google suivants : Google Image Labeler
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité
