Google ne respecte pas les robots.txt ?

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

bielle64
WRInaute impliqué
WRInaute impliqué
 
Messages: 252
Inscription: Dim Jan 19, 2003 11:28

Google ne respecte pas les robots.txt ?

Message le Dim Sep 07, 2003 23:01

Je viens de me rendre combte que Google a indexé un grand nombre de pages de mon site avec des liens php du type :
www.ossau.net/ossau/viewtopic.php?p=975
alors que j'ai bien mis dans mon robots.txt : Disallow: /ossau/viewtopic.php

Google ne respecte pas les robots.txt ??


mahefarivony
WRInaute accro
WRInaute accro
 
Messages: 11405
Inscription: Lun Oct 14, 2002 10:00

Message le Dim Sep 07, 2003 23:21


Mirgolth
WRInaute passionné
WRInaute passionné
 
Messages: 622
Inscription: Lun Oct 14, 2002 11:25

Re: Google ne respecte pas les robots.txt ?

Message le Lun Sep 08, 2003 8:32

bielle64 a écrit:Google ne respecte pas les robots.txt ??

Salut,

Ta syntaxe n'est pas bonne. Retire la ligne vide entre User-agent: et Disallow: et cela ira mieux.

Mirgolth


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15905
Inscription: Ven Avr 19, 2002 19:51

Message le Lun Sep 08, 2003 10:38

je ne savais pas que les lignes vides pouvaient poser problème ! c'est dans le standard du robots.txt ?

Mirgolth
WRInaute passionné
WRInaute passionné
 
Messages: 622
Inscription: Lun Oct 14, 2002 11:25

Message le Lun Sep 08, 2003 11:08

WebRankInfo a écrit:je ne savais pas que les lignes vides pouvaient poser problème ! c'est dans le standard du robots.txt ?

Oui, les lignes vides servent à séparer les enregistrements ( records) composés de lignes User-agents et Disallow. Voilà les lignes correspondantes dans A Standard for Robot Exclusion vers lequel Google pointe :
The file consists of one or more records separated by one or more blank lines (terminated by CR,CR/NL, or NL). Each record contains lines of the form "<field>:<optionalspace><value><optionalspace>". The field name is case insensitive.

The record starts with one or more User-agent lines, followed by one or more Disallow lines, as detailed below. Unrecognised headers are ignored.

Donc après une ligne vide on doit avoir une ligne User-agent.

Mirgolth

bielle64
WRInaute impliqué
WRInaute impliqué
 
Messages: 252
Inscription: Dim Jan 19, 2003 11:28

Message le Lun Sep 22, 2003 22:20

Merci Mirgolth, je corrige illico mon robots.txt

bielle64
WRInaute impliqué
WRInaute impliqué
 
Messages: 252
Inscription: Dim Jan 19, 2003 11:28

Message le Mar Sep 23, 2003 20:03

Je ne sais pas encore si Google respecte mon nouveau robots.txt mais je viens de me rendre d'un truc assez étrange : mon robots.txt fait partie des pages indexées par Google.
http://www.google.fr/search?q=cache:OIk ... r&ie=UTF-8

C'est normal docteur ?


mahefarivony
WRInaute accro
WRInaute accro
 
Messages: 11405
Inscription: Lun Oct 14, 2002 10:00

Message le Mar Sep 23, 2003 20:59

bin pourquoi pas

bielle64
WRInaute impliqué
WRInaute impliqué
 
Messages: 252
Inscription: Dim Jan 19, 2003 11:28

Message le Mar Sep 23, 2003 21:26

Ben je pensais qu'un fichier robots.txt n'avait qu'une valeur informative à l'usage des spiders. Donc, à mon sens, s'il est indexé c'est qu'il est pris pour une page web et donc pas exécuté.


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités