fichier robots.txt : erreurs d'analyse dans GWT

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

LionelWRI
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 25
Inscription: 10 Jan 2012

fichier robots.txt : erreurs d'analyse dans GWT

Message le Jeu Jan 19, 2012 12:10

J'ai testé mon fichier "robots.txt" généré par Google via mon compte Google à :
Configuration du site -> Accès du robot…
________________________________________________________________
Résultats de l'analyse
Valeur Résultat
Ligne 0 : http://monsite.free.fr/robots.txt Le fichier robots.txt n’est pas valide.

Texte de http://monsite.free.fr/robots.txt
User-agent: *
Allow: /

URL Spécifiez les URL et les user-agents à tester.
http://monsite.free.fr/
________________________________________________________________

Quelqu'un pourrait me dire pourquoi "Le fichier robots.txt n’est pas valide." ?

Je butte certainement sur quelque chose de simple mais je connais pas très bien tout cela…

Merci d'avance à la communauté WRI :wink:


lunicrea
WRInaute impliqué
WRInaute impliqué
 
Messages: 516
Inscription: 30 Aoû 2010

Re: fichier robots.txt

Message le Jeu Jan 19, 2012 13:31

Salut !

il me semble que la ligne Allow: n'est autorisée que pour un sitemap valide, exemple :
Code: Tout sélectionner
Allow: /sitemap.xml


Si tu n'utilises pas de Disallow et de sitemap alors il faut juste mettre
Code: Tout sélectionner
User-agent: *


Cela étant, il ne sert à rien du coup car tu ne demandes aucune restriction aux robots ...

LionelWRI
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 25
Inscription: 10 Jan 2012

Re: fichier robots.txt

Message le Jeu Jan 19, 2012 18:40

Merci. Mais même avec :

Code: Tout sélectionner
Allow: /sitemap.xml

Google m'affiche toujours : "Le fichier robots.txt n’est pas valide." :roll:


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: 3 Mai 2004

Re: fichier robots.txt

Message le Jeu Jan 19, 2012 18:51

Tu as peut-être des caractères spéciaux cachés dans ton fichier. robots.txt doit être créé avec un éditeur de texte simple comme Notepad (Bloc-notes): formatage style Word ou UTF-8 interdits.

Jean-Luc


Taranis
WRInaute impliqué
WRInaute impliqué
 
Messages: 612
Inscription: 11 Aoû 2006

Re: fichier robots.txt

Message le Jeu Jan 19, 2012 19:05


LionelWRI
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 25
Inscription: 10 Jan 2012

Re: fichier robots.txt

Message le Jeu Jan 19, 2012 19:53

En faite, j'ai mis cela :

User-agent: *
Allow: /
Disallow: / erreur404.html
Disallow: / travaux.html

Mais toujours pas reconnu par Google. Je suis sur Mac avec TextEdit qui enregistre en "Format texte".

Curieux…


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: 3 Mai 2004

Re: fichier robots.txt

Message le Jeu Jan 19, 2012 20:07

Essaie avec EXACTEMENT ceci :
Code: Tout sélectionner
User-agent: *
Disallow: /erreur404.html
Disallow: /travaux.html

J'ai supprimé le "allow" non standard et inutile et il ne fallait pas d'espace après les /.

Jean-Luc


Taranis
WRInaute impliqué
WRInaute impliqué
 
Messages: 612
Inscription: 11 Aoû 2006

Re: fichier robots.txt

Message le Jeu Jan 19, 2012 20:08

LionelWRI a écrit:En faite, j'ai mis cela :

User-agent: *
Allow: /
Disallow: / erreur404.html
Disallow: / travaux.html

Mais toujours pas reconnu par Google. Je suis sur Mac avec TextEdit qui enregistre en "Format texte".

Curieux…


Et si tu vires la ligne :
Code: Tout sélectionner
Allow: /

Ça donne quoi ?


Taranis
WRInaute impliqué
WRInaute impliqué
 
Messages: 612
Inscription: 11 Aoû 2006

Re: fichier robots.txt

Message le Jeu Jan 19, 2012 20:08

Ok, deuz :)

LionelWRI
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 25
Inscription: 10 Jan 2012

Re: fichier robots.txt

Message le Ven Jan 20, 2012 12:55

Grand merci à tous :D

Code: Tout sélectionner
User-agent: *
Disallow: /erreur404.html
Disallow: /travaux.html

était la bonne solution.

Maintenant, j'ai tenté :

Code: Tout sélectionner
User-agent: *
Sitemap: http:/monsite.free.fr/sitemap.xml
Disallow: /erreur404.html
Disallow: /travaux.html

Super !


lunicrea
WRInaute impliqué
WRInaute impliqué
 
Messages: 516
Inscription: 30 Aoû 2010

Re: fichier robots.txt

Message le Ven Jan 20, 2012 13:57

LionelWRI a écrit:
Code: Tout sélectionner
User-agent: *
Sitemap: http:/monsite.free.fr/sitemap.xml
Disallow: /erreur404.html
Disallow: /travaux.html


Hmm et ça marche cette syntaxe ?! :o


Taranis
WRInaute impliqué
WRInaute impliqué
 
Messages: 612
Inscription: 11 Aoû 2006

Re: fichier robots.txt

Message le Ven Jan 20, 2012 17:02

lunicrea a écrit:
LionelWRI a écrit:
Code: Tout sélectionner
User-agent: *
Sitemap: http:/monsite.free.fr/sitemap.xml
Disallow: /erreur404.html
Disallow: /travaux.html


Hmm et ça marche cette syntaxe ?! :o


Ben d'après ( http://www.sitemaps.org/protocol.html#submit_robots ) on dirait :)

Mais il est peut-être temps que les robots et autres crawlers se dépatouillent eux-mêmes de ce qu'ils cherchent. Les webmasters ont bien d'autres choses à faire que de s'embêter à faire des courbettes à des entreprises multi-milliardaires ;)

LionelWRI
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 25
Inscription: 10 Jan 2012

Re: fichier robots.txt

Message le Ven Jan 20, 2012 17:30

Hmm et ça marche cette syntaxe ?!

En tout cas voici les résultats que me donne Google en allant à :
Outils pour les webmasters -> Accès du robot d'exploration
Code: Tout sélectionner
________________________________________________________________________________________________
[b][size=150]Résultats de l'analyse[/size][/b]
[b]Valeur                                                                       Résultat[/b]
Ligne 2 : Sitemap: http://monsite.free.fr/sitemap.xml   Référence à un plan Sitemap valide détectée

[b]Texte de http://monsite.free.fr/robots.txt[/b]
User-agent: *
Sitemap: http://monsite.free.fr/sitemap.xml
Disallow: /erreur404.html
Disallow: /travaux.html

[b]URL[/b] Spécifiez les URL et les user-agents à tester.
http://monsite.free.fr/
________________________________________________________________________________________________

Ainsi j'autorise tous les robots à indexer mes pages, à consulter mon fichier "sitemap.xml" mais je ne les autorise pas à indexer les pages "erreur404.html" ni "travaux.html" (si j'ai tout bien compris). J'espère que c'est suffisant...

Encore merci à votre aide à tous :)

Maintenant je vais m'occuper des balises meta robots et meta sitemap. :roll:


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 19415
Inscription: 19 Avr 2002

Re: fichier robots.txt

Message le Lun Jan 23, 2012 10:25

lunicrea a écrit:Salut !

il me semble que la ligne Allow: n'est autorisée que pour un sitemap valide, exemple :
Code: Tout sélectionner
Allow: /sitemap.xml


Si tu n'utilises pas de Disallow et de sitemap alors il faut juste mettre
Code: Tout sélectionner
User-agent: *

Attention :
- pour déclarer un sitemap dans le fichier robots.txt ce n'est pas Allow mais sitemap
- Allow ne sert à rien il me semble, le fichier robots.txt ne sert qu'à interdire le crawl (par défaut tout le reste est autorisé)

Autres remarques :
- si tu n'as rien à interdire sur le site, tu peux mettre un fichier totalement vide, ça ira très bien et ça ne génèrera aucune erreur
- parfois le fichier sitemap contient des indications que l'on ne devrait pas donner aux concurrents. Dans ce cas il ne faut pas le nommer sitemap.xml et il ne faut pas le déclarer dans le fichier robots.txt mais directement dans Google Webmaster Tools.


NickyLarson
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 315
Inscription: 8 Avr 2008

Re: fichier robots.txt

Message le Lun Jan 23, 2012 10:34

WebRankInfo a écrit:- Allow ne sert à rien il me semble, le fichier robots.txt ne sert qu'à interdire le crawl (par défaut tout le reste est autorisé)


Du coup, pour le robots.txt de WRI, ceci n'est pas correct (même si cela n'a pas d'impact)?

User-agent: googlebot-image
Allow: /images/

Un autre exemple, actuellement sur WRI le fichier est sous cette forme:
User-agent: Xenu's Link Sleuth 1.1c
User-agent: YRSPider
User-agent: Zeus
Disallow: /

Est-ce correcte pour donner une instruction générale?
Ou alors il faudrait faire plutôt comme ceci:

User-agent: Xenu's Link Sleuth 1.1c
Disallow: /

User-agent: YRSPider
Disallow: /

User-agent: Zeus
Disallow: /

fichier robots.txt : erreurs d'analyse dans GWT

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités