fichier robots.txt : erreurs d'analyse dans GWT
37 messages
• Page 1 sur 3 • 1, 2, 3
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- LionelWRI
- Nouveau WRInaute

- Messages: 25
- Inscription: 10 Jan 2012
fichier robots.txt : erreurs d'analyse dans GWT
J'ai testé mon fichier "robots.txt" généré par Google via mon compte Google à :
Configuration du site -> Accès du robot…
________________________________________________________________
Résultats de l'analyse
Valeur Résultat
Ligne 0 : http://monsite.free.fr/robots.txt Le fichier robots.txt n’est pas valide.
Texte de http://monsite.free.fr/robots.txt
User-agent: *
Allow: /
URL Spécifiez les URL et les user-agents à tester.
http://monsite.free.fr/
________________________________________________________________
Quelqu'un pourrait me dire pourquoi "Le fichier robots.txt n’est pas valide." ?
Je butte certainement sur quelque chose de simple mais je connais pas très bien tout cela…
Merci d'avance à la communauté WRI
Configuration du site -> Accès du robot…
________________________________________________________________
Résultats de l'analyse
Valeur Résultat
Ligne 0 : http://monsite.free.fr/robots.txt Le fichier robots.txt n’est pas valide.
Texte de http://monsite.free.fr/robots.txt
User-agent: *
Allow: /
URL Spécifiez les URL et les user-agents à tester.
http://monsite.free.fr/
________________________________________________________________
Quelqu'un pourrait me dire pourquoi "Le fichier robots.txt n’est pas valide." ?
Je butte certainement sur quelque chose de simple mais je connais pas très bien tout cela…
Merci d'avance à la communauté WRI
-

lunicrea - WRInaute impliqué

- Messages: 516
- Inscription: 30 Aoû 2010
Re: fichier robots.txt
Salut !
il me semble que la ligne Allow: n'est autorisée que pour un sitemap valide, exemple :
Si tu n'utilises pas de Disallow et de sitemap alors il faut juste mettre
Cela étant, il ne sert à rien du coup car tu ne demandes aucune restriction aux robots ...
il me semble que la ligne Allow: n'est autorisée que pour un sitemap valide, exemple :
- Code: Tout sélectionner
Allow: /sitemap.xml
Si tu n'utilises pas de Disallow et de sitemap alors il faut juste mettre
- Code: Tout sélectionner
User-agent: *
Cela étant, il ne sert à rien du coup car tu ne demandes aucune restriction aux robots ...
- LionelWRI
- Nouveau WRInaute

- Messages: 25
- Inscription: 10 Jan 2012
Re: fichier robots.txt
Merci. Mais même avec :
Google m'affiche toujours : "Le fichier robots.txt n’est pas valide."
- Code: Tout sélectionner
Allow: /sitemap.xml
Google m'affiche toujours : "Le fichier robots.txt n’est pas valide."
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Re: fichier robots.txt
Essaie avec EXACTEMENT ceci :
J'ai supprimé le "allow" non standard et inutile et il ne fallait pas d'espace après les /.
Jean-Luc
- Code: Tout sélectionner
User-agent: *
Disallow: /erreur404.html
Disallow: /travaux.html
J'ai supprimé le "allow" non standard et inutile et il ne fallait pas d'espace après les /.
Jean-Luc
-

Taranis - WRInaute impliqué

- Messages: 612
- Inscription: 11 Aoû 2006
Re: fichier robots.txt
LionelWRI a écrit:En faite, j'ai mis cela :
User-agent: *
Allow: /
Disallow: / erreur404.html
Disallow: / travaux.html
Mais toujours pas reconnu par Google. Je suis sur Mac avec TextEdit qui enregistre en "Format texte".
Curieux…
Et si tu vires la ligne :
- Code: Tout sélectionner
Allow: /
Ça donne quoi ?
- LionelWRI
- Nouveau WRInaute

- Messages: 25
- Inscription: 10 Jan 2012
Re: fichier robots.txt
Grand merci à tous
était la bonne solution.
Maintenant, j'ai tenté :
Super !
- Code: Tout sélectionner
User-agent: *
Disallow: /erreur404.html
Disallow: /travaux.html
était la bonne solution.
Maintenant, j'ai tenté :
- Code: Tout sélectionner
User-agent: *
Sitemap: http:/monsite.free.fr/sitemap.xml
Disallow: /erreur404.html
Disallow: /travaux.html
Super !
-

lunicrea - WRInaute impliqué

- Messages: 516
- Inscription: 30 Aoû 2010
Re: fichier robots.txt
LionelWRI a écrit:
- Code: Tout sélectionner
User-agent: *
Sitemap: http:/monsite.free.fr/sitemap.xml
Disallow: /erreur404.html
Disallow: /travaux.html
Hmm et ça marche cette syntaxe ?!
-

Taranis - WRInaute impliqué

- Messages: 612
- Inscription: 11 Aoû 2006
Re: fichier robots.txt
lunicrea a écrit:LionelWRI a écrit:
- Code: Tout sélectionner
User-agent: *
Sitemap: http:/monsite.free.fr/sitemap.xml
Disallow: /erreur404.html
Disallow: /travaux.html
Hmm et ça marche cette syntaxe ?!
Ben d'après ( http://www.sitemaps.org/protocol.html#submit_robots ) on dirait
Mais il est peut-être temps que les robots et autres crawlers se dépatouillent eux-mêmes de ce qu'ils cherchent. Les webmasters ont bien d'autres choses à faire que de s'embêter à faire des courbettes à des entreprises multi-milliardaires
- LionelWRI
- Nouveau WRInaute

- Messages: 25
- Inscription: 10 Jan 2012
Re: fichier robots.txt
Hmm et ça marche cette syntaxe ?!
En tout cas voici les résultats que me donne Google en allant à :
Outils pour les webmasters -> Accès du robot d'exploration
- Code: Tout sélectionner
________________________________________________________________________________________________
[b][size=150]Résultats de l'analyse[/size][/b]
[b]Valeur Résultat[/b]
Ligne 2 : Sitemap: http://monsite.free.fr/sitemap.xml Référence à un plan Sitemap valide détectée
[b]Texte de http://monsite.free.fr/robots.txt[/b]
User-agent: *
Sitemap: http://monsite.free.fr/sitemap.xml
Disallow: /erreur404.html
Disallow: /travaux.html
[b]URL[/b] Spécifiez les URL et les user-agents à tester.
http://monsite.free.fr/
________________________________________________________________________________________________
Ainsi j'autorise tous les robots à indexer mes pages, à consulter mon fichier "sitemap.xml" mais je ne les autorise pas à indexer les pages "erreur404.html" ni "travaux.html" (si j'ai tout bien compris). J'espère que c'est suffisant...
Encore merci à votre aide à tous
Maintenant je vais m'occuper des balises meta robots et meta sitemap.
-

WebRankInfo - Administrateur du site

- Messages: 19415
- Inscription: 19 Avr 2002
Re: fichier robots.txt
lunicrea a écrit:Salut !
il me semble que la ligne Allow: n'est autorisée que pour un sitemap valide, exemple :
- Code: Tout sélectionner
Allow: /sitemap.xml
Si tu n'utilises pas de Disallow et de sitemap alors il faut juste mettre
- Code: Tout sélectionner
User-agent: *
Attention :
- pour déclarer un sitemap dans le fichier robots.txt ce n'est pas Allow mais sitemap
- Allow ne sert à rien il me semble, le fichier robots.txt ne sert qu'à interdire le crawl (par défaut tout le reste est autorisé)
Autres remarques :
- si tu n'as rien à interdire sur le site, tu peux mettre un fichier totalement vide, ça ira très bien et ça ne génèrera aucune erreur
- parfois le fichier sitemap contient des indications que l'on ne devrait pas donner aux concurrents. Dans ce cas il ne faut pas le nommer sitemap.xml et il ne faut pas le déclarer dans le fichier robots.txt mais directement dans Google Webmaster Tools.
-

NickyLarson - WRInaute occasionnel

- Messages: 315
- Inscription: 8 Avr 2008
Re: fichier robots.txt
WebRankInfo a écrit:- Allow ne sert à rien il me semble, le fichier robots.txt ne sert qu'à interdire le crawl (par défaut tout le reste est autorisé)
Du coup, pour le robots.txt de WRI, ceci n'est pas correct (même si cela n'a pas d'impact)?
User-agent: googlebot-image
Allow: /images/
Un autre exemple, actuellement sur WRI le fichier est sous cette forme:
User-agent: Xenu's Link Sleuth 1.1c
User-agent: YRSPider
User-agent: Zeus
Disallow: /
Est-ce correcte pour donner une instruction générale?
Ou alors il faudrait faire plutôt comme ceci:
User-agent: Xenu's Link Sleuth 1.1c
Disallow: /
User-agent: YRSPider
Disallow: /
User-agent: Zeus
Disallow: /
37 messages
• Page 1 sur 3 • 1, 2, 3
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- erreurs Fichier Robots.txt
- soumission du fichier robots.txt dans GWT : interdit (403)
- GWT : URL à accès restreint par un fichier robots.txt
- Erreurs Robots.txt sans fichier Robots.txt
- GWT : Erreurs d'exploration
- Erreurs dans GWT
- Analyse comparative GWT et GG Analytics
- Erreurs SOFT 404 sur GWT
- GWT : Nombreuses erreurs d'exploration (pourtant corrigées)
- Crawl de pages qui n'existent plus et forcément erreurs GWT :/
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
