robots.txt fantôme ?
10 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- Invité
robots.txt fantôme ?
Dans le fichier web.log de notre site larkconsultants.com, je trouve une ligne isolée concernant un crawler de Google
Il me semble que 302 est le code de réponse à la demande du fichier robots.txt, et qu'il signifie Found.
Si cette supposition
est juste, elle est surprenante car le site ne contient aucun fichier robots.txt.
D'ailleurs, le crawler quitte le site après cette unique demande.
Je serais reconnaissant pour tout commentaire, car j'essaie comprendre pourquoi notre site, existant depuis onze mois, n'est pas visible chez Google.
Jacek
crawler10.googlebot.com - - [23/Nov/2002:05:21:48 +0100] "GET /robots.txt HTTP/1.0" 302 221 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
Il me semble que 302 est le code de réponse à la demande du fichier robots.txt, et qu'il signifie Found.
Si cette supposition
D'ailleurs, le crawler quitte le site après cette unique demande.
Je serais reconnaissant pour tout commentaire, car j'essaie comprendre pourquoi notre site, existant depuis onze mois, n'est pas visible chez Google.
Jacek
- Mirgolth
- WRInaute impliqué

- Messages: 622
- Inscription: 14 Oct 2002
Salut,
Les 3XX ce sont les redirections et effectivement larkconsultants.com/robots.txt redirige bien une page "File Not Found".
Essayes de mettre un robots.txt comme celui là:
Mirgolth
Les 3XX ce sont les redirections et effectivement larkconsultants.com/robots.txt redirige bien une page "File Not Found".
Essayes de mettre un robots.txt comme celui là:
- Code: Tout sélectionner
# Allow all
User-agent: *
Disallow:
Mirgolth
- Invité
Mirgolth,
Comme j'ai appris chez -www.searchengineworld.com/robots/robots_tutorial.htm, robots.txt fait partie de The Robots Exclusion Standard, et, si je comprends bien
, son absence veut dire "Toutes pages admises pour les robots".
Donc, le robots.txt que vous proposez, paraît superflu.
Jacek
Comme j'ai appris chez -www.searchengineworld.com/robots/robots_tutorial.htm, robots.txt fait partie de The Robots Exclusion Standard, et, si je comprends bien
Donc, le robots.txt que vous proposez, paraît superflu.
Jacek
- Mirgolth
- WRInaute impliqué

- Messages: 622
- Inscription: 14 Oct 2002
Son absence veut dire de parcourir toutes les pages.
Dans ton cas tu rediriges temporairement ( 302 ) vers une autre url qui n'a pas du tout la bonne syntaxe. Il y a de quoi rendre un robot perplexe...
Même un fichier vide sera moins ambigue pour les robots. C'est d'ailleurs l'autre méthode recommandé.
Je te recommande le Web Server Administrator's Guide to the Robots Exclusion Protocol
Mirgolth
Dans ton cas tu rediriges temporairement ( 302 ) vers une autre url qui n'a pas du tout la bonne syntaxe. Il y a de quoi rendre un robot perplexe...
Même un fichier vide sera moins ambigue pour les robots. C'est d'ailleurs l'autre méthode recommandé.
Je te recommande le Web Server Administrator's Guide to the Robots Exclusion Protocol
Mirgolth
- Invité
tu rediriges temporairement ( 302 ) vers une autre url qui n'a pas du tout la bonne syntaxe. Il y a de quoi rendre un robot perplexe...
Mirgolth,
La psychanalyse de robots me dépasse, mais je comprends votre remarque comme un bienveillant conseil.
Je viens de créer ce robots.txt sur le site.
Merci beaucoup,
Jacek
-

athletissimo - WRInaute discret

- Messages: 126
- Inscription: 27 Aoû 2002
Je vous confirme qu'il vaut mieux avoir un fichier robots.txt qui ne sert pas toujours que d'avoir une redirection automatique est peut etre préjudiciable.
et ce n'est pas 1 ko qui vont allourdir le site
et ce n'est pas 1 ko qui vont allourdir le site
- Invité
...il vaut mieux avoir un fichier robots.txt qui ne sert pas toujours que d'avoir une redirection automatique est peut etre préjudiciable.
C'est de cette manière que j'ai compris le bienveillant conseil de Mirgolth.
Jacek
- DarkShadow
- Nouveau WRInaute

- Messages: 1
- Inscription: 13 Jan 2003
robots.txt generé avec RobotPack
Pour t'aider a générer ton fichier robots.txt tu peux utilise un logiciel gratuit qui s'appel RobotPack, disponible ici : http://www.soho-it.com/robotpack/
Bonne journée
DarkShadow
Bonne journée
DarkShadow
Dernière édition par DarkShadow le Lun Jan 13, 2003 9:14, édité 1 fois.
-

hetzeld - WRInaute passionné

- Messages: 2209
- Inscription: 2 Déc 2002
Mirgolth a écrit:Les 3XX ce sont les redirections et effectivement larkconsultants.com/robots.txt redirige bien une page "File Not Found".
Bonjour,
Le code 301 est une redirection permanente, alors que le 302 est une redirection temporaire.Par exemple, dans le cas d'un hébergement OVH, comme tous les sites web sont "clusterisés", on a automatiqument un code 302 pour toutes les pages.
Le 302 a pour but de faire savoir au navigateur/moteur que la page ne se trouve pas forcément à la même adresse physique (le même chemin serveur) et est un code "found" au même titre que le code 200.
Dan
-

hetzeld - WRInaute passionné

- Messages: 2209
- Inscription: 2 Déc 2002
Anonymous a écrit:Mirgolth,
Comme j'ai appris chez -www.searchengineworld.com/robots/robots_tutorial.htm, robots.txt fait partie de The Robots Exclusion Standard, et, si je comprends bien, son absence veut dire "Toutes pages admises pour les robots".
Donc, le robots.txt que vous proposez, paraît superflu.
Jacek
C'est vrai que sous cette syntaxe là, il n'est pas indispensable!
Sa présence évite d'avoir un fichier log qui se remplit d'erreurs 404 à chaque fois que le fichier robots.txt est requis.
Dan
10 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Sortie de GoogleStats v2.01 - 02-03-2003
- Les crawlers de Yahoo! - 18-03-2004
- Les robots MSNbot de Live Search - 30-11-2006
- Déclarer son fichier sitemap dans le fichier robots.txt - 16-04-2007
- Petit changement pour Slurp (le robot de Yahoo) - 29-03-2007
- La balise meta NOYDIR de Yahoo - 05-03-2007
- Robots.txt : Yahoo supporte les options avancées - 04-11-2006
- Comment gérer simplement les sitemaps de plusieurs sites au même endroit - 28-02-2008
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
