robots.txt fantôme ?
10 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
- Invité
robots.txt fantôme ?
Dans le fichier web.log de notre site larkconsultants.com, je trouve une ligne isolée concernant un crawler de Google
Il me semble que 302 est le code de réponse à la demande du fichier robots.txt, et qu'il signifie Found.
Si cette supposition
est juste, elle est surprenante car le site ne contient aucun fichier robots.txt.
D'ailleurs, le crawler quitte le site après cette unique demande.
Je serais reconnaissant pour tout commentaire, car j'essaie comprendre pourquoi notre site, existant depuis onze mois, n'est pas visible chez Google.
Jacek
crawler10.googlebot.com - - [23/Nov/2002:05:21:48 +0100] "GET /robots.txt HTTP/1.0" 302 221 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
Il me semble que 302 est le code de réponse à la demande du fichier robots.txt, et qu'il signifie Found.
Si cette supposition
D'ailleurs, le crawler quitte le site après cette unique demande.
Je serais reconnaissant pour tout commentaire, car j'essaie comprendre pourquoi notre site, existant depuis onze mois, n'est pas visible chez Google.
Jacek
Salut,
Les 3XX ce sont les redirections et effectivement larkconsultants.com/robots.txt redirige bien une page "File Not Found".
Essayes de mettre un robots.txt comme celui là:
Mirgolth
Les 3XX ce sont les redirections et effectivement larkconsultants.com/robots.txt redirige bien une page "File Not Found".
Essayes de mettre un robots.txt comme celui là:
- Code: Tout sélectionner
# Allow all
User-agent: *
Disallow:
Mirgolth
- Invité
Mirgolth,
Comme j'ai appris chez -www.searchengineworld.com/robots/robots_tutorial.htm, robots.txt fait partie de The Robots Exclusion Standard, et, si je comprends bien
, son absence veut dire "Toutes pages admises pour les robots".
Donc, le robots.txt que vous proposez, paraît superflu.
Jacek
Comme j'ai appris chez -www.searchengineworld.com/robots/robots_tutorial.htm, robots.txt fait partie de The Robots Exclusion Standard, et, si je comprends bien
Donc, le robots.txt que vous proposez, paraît superflu.
Jacek
Son absence veut dire de parcourir toutes les pages.
Dans ton cas tu rediriges temporairement ( 302 ) vers une autre url qui n'a pas du tout la bonne syntaxe. Il y a de quoi rendre un robot perplexe...
Même un fichier vide sera moins ambigue pour les robots. C'est d'ailleurs l'autre méthode recommandé.
Je te recommande le Web Server Administrator's Guide to the Robots Exclusion Protocol
Mirgolth
Dans ton cas tu rediriges temporairement ( 302 ) vers une autre url qui n'a pas du tout la bonne syntaxe. Il y a de quoi rendre un robot perplexe...
Même un fichier vide sera moins ambigue pour les robots. C'est d'ailleurs l'autre méthode recommandé.
Je te recommande le Web Server Administrator's Guide to the Robots Exclusion Protocol
Mirgolth
- Invité
tu rediriges temporairement ( 302 ) vers une autre url qui n'a pas du tout la bonne syntaxe. Il y a de quoi rendre un robot perplexe...
Mirgolth,
La psychanalyse de robots me dépasse, mais je comprends votre remarque comme un bienveillant conseil.
Je viens de créer ce robots.txt sur le site.
Merci beaucoup,
Jacek
-

athletissimo - WRInaute occasionnel

- Messages: 126
- Inscription: Mar Aoû 27, 2002 15:55
Je vous confirme qu'il vaut mieux avoir un fichier robots.txt qui ne sert pas toujours que d'avoir une redirection automatique est peut etre préjudiciable.
et ce n'est pas 1 ko qui vont allourdir le site
et ce n'est pas 1 ko qui vont allourdir le site
- Invité
...il vaut mieux avoir un fichier robots.txt qui ne sert pas toujours que d'avoir une redirection automatique est peut etre préjudiciable.
C'est de cette manière que j'ai compris le bienveillant conseil de Mirgolth.
Jacek
- DarkShadow
- Nouveau WRInaute
- Messages: 1
- Inscription: Lun Jan 13, 2003 4:35
robots.txt generé avec RobotPack
Pour t'aider a générer ton fichier robots.txt tu peux utilise un logiciel gratuit qui s'appel RobotPack, disponible ici : http://www.soho-it.com/robotpack/
Bonne journée
DarkShadow
Bonne journée
DarkShadow
Dernière édition par DarkShadow le Lun Jan 13, 2003 9:14, édité 1 fois.
Mirgolth a écrit:Les 3XX ce sont les redirections et effectivement larkconsultants.com/robots.txt redirige bien une page "File Not Found".
Bonjour,
Le code 301 est une redirection permanente, alors que le 302 est une redirection temporaire.Par exemple, dans le cas d'un hébergement OVH, comme tous les sites web sont "clusterisés", on a automatiqument un code 302 pour toutes les pages.
Le 302 a pour but de faire savoir au navigateur/moteur que la page ne se trouve pas forcément à la même adresse physique (le même chemin serveur) et est un code "found" au même titre que le code 200.
Dan
Anonymous a écrit:Mirgolth,
Comme j'ai appris chez -www.searchengineworld.com/robots/robots_tutorial.htm, robots.txt fait partie de The Robots Exclusion Standard, et, si je comprends bien, son absence veut dire "Toutes pages admises pour les robots".
Donc, le robots.txt que vous proposez, paraît superflu.
Jacek
C'est vrai que sous cette syntaxe là, il n'est pas indispensable!
Sa présence évite d'avoir un fichier log qui se remplit d'erreurs 404 à chaque fois que le fichier robots.txt est requis.
Dan
10 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Sortie de GoogleStats v2.01
- Les crawlers de Yahoo!
- Les robots MSNbot de Live Search
- Déclarer son fichier sitemap dans le fichier robots.txt
- Petit changement pour Slurp (le robot de Yahoo)
- Robots.txt : Yahoo supporte les options avancées
- La balise meta NOYDIR de Yahoo
- Comment gérer simplement les sitemaps de plusieurs sites au même endroit
- Alexa lance un moteur de recherche d'images
- Sortie officielle de GoogleStats v2.0 !
- .htaccess fantôme
- Referer fantôme...
- Forum Fantôme °°) !
- JavaScript fantôme...
- Un fil RSS fantome
- AdSense : Clic fantôme
- Campagne Fantome dans analytics
- Referer fantome sur live
- Positionnement fantôme 1 jour sur 2 !
- [résolu]dossier fantome+éviter le duplicate content :/
- Site fantome dans Google [Réglé]
- Le mysterieux site fantome - ceci n'est pas un episode de...
- robots.txt et balise meta robots, incompatibilité ?
- Interdire certains robots ? Comment ? Quels robots ?
- Robots utiles et robots inutiles
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités




le forum