robots.txt fantôme ?

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

Invité
 

robots.txt fantôme ?

Message le Jeu Nov 28, 2002 11:09

Dans le fichier web.log de notre site larkconsultants.com, je trouve une ligne isolée concernant un crawler de Google
crawler10.googlebot.com - - [23/Nov/2002:05:21:48 +0100] "GET /robots.txt HTTP/1.0" 302 221 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"

Il me semble que 302 est le code de réponse à la demande du fichier robots.txt, et qu'il signifie Found.
Si cette supposition :?: est juste, elle est surprenante car le site ne contient aucun fichier robots.txt.
D'ailleurs, le crawler quitte le site après cette unique demande.

Je serais reconnaissant pour tout commentaire, car j'essaie comprendre pourquoi notre site, existant depuis onze mois, n'est pas visible chez Google.

Jacek

Mirgolth
WRInaute passionné
WRInaute passionné
 
Messages: 622
Inscription: Lun Oct 14, 2002 11:25

Message le Jeu Nov 28, 2002 12:04

Salut,

Les 3XX ce sont les redirections et effectivement larkconsultants.com/robots.txt redirige bien une page "File Not Found".

Essayes de mettre un robots.txt comme celui là:
Code: Tout sélectionner
# Allow all
User-agent:  *
Disallow:


Mirgolth

Invité
 

Message le Jeu Nov 28, 2002 12:20

Mirgolth,

Comme j'ai appris chez -www.searchengineworld.com/robots/robots_tutorial.htm, robots.txt fait partie de The Robots Exclusion Standard, et, si je comprends bien :?: , son absence veut dire "Toutes pages admises pour les robots".
Donc, le robots.txt que vous proposez, paraît superflu.

Jacek

Mirgolth
WRInaute passionné
WRInaute passionné
 
Messages: 622
Inscription: Lun Oct 14, 2002 11:25

Message le Jeu Nov 28, 2002 12:43

Son absence veut dire de parcourir toutes les pages.

Dans ton cas tu rediriges temporairement ( 302 ) vers une autre url qui n'a pas du tout la bonne syntaxe. Il y a de quoi rendre un robot perplexe...

Même un fichier vide sera moins ambigue pour les robots. C'est d'ailleurs l'autre méthode recommandé.
Je te recommande le Web Server Administrator's Guide to the Robots Exclusion Protocol

Mirgolth

Invité
 

Message le Jeu Nov 28, 2002 14:17

tu rediriges temporairement ( 302 ) vers une autre url qui n'a pas du tout la bonne syntaxe. Il y a de quoi rendre un robot perplexe...


Mirgolth,

La psychanalyse de robots me dépasse, mais je comprends votre remarque comme un bienveillant conseil.
Je viens de créer ce robots.txt sur le site.

Merci beaucoup,
Jacek


athletissimo
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 126
Inscription: Mar Aoû 27, 2002 15:55

Message le Jeu Nov 28, 2002 21:38

Je vous confirme qu'il vaut mieux avoir un fichier robots.txt qui ne sert pas toujours que d'avoir une redirection automatique est peut etre préjudiciable.

et ce n'est pas 1 ko qui vont allourdir le site :-)

Invité
 

Message le Jeu Nov 28, 2002 21:49

...il vaut mieux avoir un fichier robots.txt qui ne sert pas toujours que d'avoir une redirection automatique est peut etre préjudiciable.


C'est de cette manière que j'ai compris le bienveillant conseil de Mirgolth.

Jacek

DarkShadow
Nouveau WRInaute
 
Messages: 1
Inscription: Lun Jan 13, 2003 4:35

robots.txt generé avec RobotPack

Message le Lun Jan 13, 2003 4:38

Pour t'aider a générer ton fichier robots.txt tu peux utilise un logiciel gratuit qui s'appel RobotPack, disponible ici : http://www.soho-it.com/robotpack/

Bonne journée

DarkShadow
Dernière édition par DarkShadow le Lun Jan 13, 2003 9:14, édité 1 fois.


hetzeld
WRInaute accro
WRInaute accro
 
Messages: 2209
Inscription: Lun Déc 02, 2002 18:21

Message le Lun Jan 13, 2003 8:35

Mirgolth a écrit:Les 3XX ce sont les redirections et effectivement larkconsultants.com/robots.txt redirige bien une page "File Not Found".


Bonjour,

Le code 301 est une redirection permanente, alors que le 302 est une redirection temporaire.Par exemple, dans le cas d'un hébergement OVH, comme tous les sites web sont "clusterisés", on a automatiqument un code 302 pour toutes les pages.
Le 302 a pour but de faire savoir au navigateur/moteur que la page ne se trouve pas forcément à la même adresse physique (le même chemin serveur) et est un code "found" au même titre que le code 200.

Dan


hetzeld
WRInaute accro
WRInaute accro
 
Messages: 2209
Inscription: Lun Déc 02, 2002 18:21

Message le Lun Jan 13, 2003 8:37

Anonymous a écrit:Mirgolth,
Comme j'ai appris chez -www.searchengineworld.com/robots/robots_tutorial.htm, robots.txt fait partie de The Robots Exclusion Standard, et, si je comprends bien :?: , son absence veut dire "Toutes pages admises pour les robots".
Donc, le robots.txt que vous proposez, paraît superflu.
Jacek

C'est vrai que sous cette syntaxe là, il n'est pas indispensable!
Sa présence évite d'avoir un fichier log qui se remplit d'erreurs 404 à chaque fois que le fichier robots.txt est requis.

Dan


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités