robot.txt et erreur 404

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

xicor
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 18
Inscription: 21 Avr 2003

robot.txt et erreur 404

Message le Jeu Juin 19, 2003 15:48

Bonjlour,

J'ai repéré la ligne suivante dans mes logs:
64.68.82.68 web10 - [19/Jun/2003:00:26:50 +0200] "GET /robots.txt HTTP/1.0" 404 283 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)".

Le 404 n'est pas erreur 404?

Pourtant j'ai bien le fichier robot.txt suivant à la racine de mon site:


Code: Tout sélectionner
# Allow all
User-agent: *
Disallow:/pdf/
Disallow:/baseline.html
Disallow:/blanc.html
Disallow:/nav.html
Disallow:/construction.html
Disallow:/construction_merci.html
Disallow:/xls/


Merci pour votre aide.

Vortex
WRInaute discret
WRInaute discret
 
Messages: 87
Inscription: 27 Mai 2003

Message le Jeu Juin 19, 2003 16:00

il manque pas un 'S' à ton fichier robotS.txt ?????


cdpdf
WRInaute impliqué
WRInaute impliqué
 
Messages: 953
Inscription: 11 Mar 2003

Message le Jeu Juin 19, 2003 16:02

c'est bete mais c'est comme cela


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 19420
Inscription: 19 Avr 2002

Message le Jeu Juin 19, 2003 16:03


xicor
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 18
Inscription: 21 Avr 2003

Message le Jeu Juin 19, 2003 16:10

honte à moi, il manquait bien un S

Désolé pour le dérangement

merçi

Vortex
WRInaute discret
WRInaute discret
 
Messages: 87
Inscription: 27 Mai 2003

Message le Ven Juin 20, 2003 9:08

Pas grave... je t'avouerai que moi, la premiere fois que j'ai voulu mettre un robots.txt, je savais pas si il fallait un S ou pas... du coup j'ai mis 2 fichiers, un avec le S, l'autre sans :)


hetzeld
WRInaute passionné
WRInaute passionné
 
Messages: 2209
Inscription: 2 Déc 2002

Message le Ven Juin 20, 2003 14:23

Vortex a écrit:Pas grave... je t'avouerai que moi, la premiere fois que j'ai voulu mettre un robots.txt, je savais pas si il fallait un S ou pas... du coup j'ai mis 2 fichiers, un avec le S, l'autre sans :)

Ce n'aurait pas été plus simple de chercher sur Google ? :lol:

Mies Van der Rohe
WRInaute passionné
WRInaute passionné
 
Messages: 1562
Inscription: 7 Déc 2002

Message le Ven Juin 20, 2003 14:25

Par rapport à ça, je trouve en effet qui'il est beaucoup plus préis de chercher via Google que de chercher avec le moteur interne du forum. pas vous?


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 19420
Inscription: 19 Avr 2002

Message le Ven Juin 20, 2003 16:48

Mies Van der Rohe a écrit:Par rapport à ça, je trouve en effet qui'il est beaucoup plus préis de chercher via Google que de chercher avec le moteur interne du forum. pas vous?

si c'est vraiment le cas je désactive l'indexation du forum car ça prend au moins 50% de l'espace disque dans la base de données (phpBB).
autant laisser Google travailler !

vincent Fraternet
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 3
Inscription: 9 Jan 2004

Message le Ven Juin 17, 2005 16:12

Bonjour,

Je reviens sur le probléme concernant le fichier robots.txt.

Certains moteurs comme Yahoo! Slurp et Pompos (par exemple). Lors de l'appel du fichier robots.txt, ils retournent une erreur 404.

Voici les infos sur le fichier
[kiki@bibi]# cat robots.txt
User-agent: *
Disallow:/analog-docs/
Disallow:/cgi-bin/

[kiki@bibi]# file robots.txt
robots.txt: ASCII text

68.142.251.145 - [17/Jun/2005:16:55:55 +0200] www.xxxxxxxxxx "GET /robots.txt HTTP/1.0" 404 11737 0 32696 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)

Je comprend pas bien pourquoi, ça me retourne une erreur 404 ?

Vincent

vincent Fraternet
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 3
Inscription: 9 Jan 2004

Message le Ven Juin 17, 2005 16:37

J'ai commis une petite erreur.

C'est cette syntax
User-agent: *
Disallow: /analog-docs/
Disallow: /cgi-bin/

et non
User-agent: *
Disallow:/analog-docs/
Disallow:/cgi-bin/

Ca décolle maintenant.

Amaryllid
WRInaute discret
WRInaute discret
 
Messages: 172
Inscription: 8 Avr 2005

Message le Ven Juin 17, 2005 19:08

vincent Fraternet a écrit:J'ai commis une petite erreur.

Je ne crois pas.
L'espace ou "blanc" qui suit User-agent: et Disallow: est facultatif.
Ca doit être écrit là dedans :
http://www.robotstxt.org/wc/norobots.html

PS : Est-ce qu'il ne faudrait pas éditer le titre (robot.txt) pour ne pas induire des débutants en erreur s'il ne lisent pas le fil ? (en ajoutant un gros S par exemple).


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: 3 Mai 2004

Message le Ven Juin 17, 2005 19:31

vincent Fraternet a écrit:Certains moteurs comme Yahoo! Slurp et Pompos (par exemple). Lors de l'appel du fichier robots.txt, ils retournent une erreur 404.

Bonjour,

Cette erreur veut dire que le fichier robots.txt n'est pas présent sur ton système... donc pas la peine de parler de son contenu, puisque le fichier n'est pas là ou pas à la bonne place ou pas lisible ou pas avec le bon nom de fichier. :wink:

Jean-Luc

vincent Fraternet
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 3
Inscription: 9 Jan 2004

Erreur 404 sur robots.txt

Message le Sam Juin 18, 2005 13:50

Effectivement, c'était bien Apache qui était mal configuré !!

Désolé, du dérangement !


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités