Fichier robots.txt

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


Suede
WRInaute accro
WRInaute accro
 
Messages: 3721
Inscription: Ven Oct 04, 2002 11:22

Fichier robots.txt

Message le Sam Oct 23, 2004 18:17

Bonjour,

Je viens de voir que malgré mon fichier robots.txt http://www.photos-suede.com/robots.txt
Code: Tout sélectionner
User-agent:  *
Disallow: /forum/login.php
Disallow: /forum/modcp.php
Disallow: /forum/posting.php
Disallow: /forum/printview.php
Disallow: /forum/privmsg.php
Disallow: /forum/search.php
Disallow: /forum/viewonline.php


Je suis quans même dans Google :
http://www.google.fr/search?as_q=&num=1 ... itesearch=

Le fichier est là depuis mars.

A priori, il respecte le standard du fichier robots.txt ( http://www.webrankinfo.com/outils/robots/faq_15_113.htm par exemple)

D'autres cas ?

François

Jeromeb
WRInaute impliqué
WRInaute impliqué
 
Messages: 263
Inscription: Lun Oct 04, 2004 19:46

Message le Sam Oct 23, 2004 18:24

Suède,

Oui, ça arrive souvent ces temps ci. Il parait qu'un nouveau robot** Google est arrivé, il est peut être mal configuré.

** peut être une robote vu le résultat du mot clé Jaimemaboite ; conférer ancien message


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2658
Inscription: Lun Mai 03, 2004 14:48

Re: Fichier robots.txt

Message le Sam Oct 23, 2004 19:21

Bonjour Suede,

La réponse est que ton robots.txt interdit à Google de lire /forum/login.php et Google respecte cette interdiction.

Par contre, dans d'autres pages dont tu autorises la visite, il trouve des liens vers /forum/login.php et, sans visiter la page, il en connaît l'existence. C'est ainsi que cette page - non lue, donc sans mise en cache - se retrouve dans les résultats Google.

C'est contrariant, mais logique ... :wink:

Jean-Luc


Suede
WRInaute accro
WRInaute accro
 
Messages: 3721
Inscription: Ven Oct 04, 2002 11:22

Message le Sam Oct 23, 2004 20:09

Oui,
Le standard parle de visite mais google utilise les termes visites et index quand ils parlent de meta et robots.
Le probleme est que même sans être visitée, la page est indexée et apparait sur des recherches. Dans mon cas, ce n'est pas un probleme, mais dans d'autres cas, si le nom du fichier est plus explicite, ca peut etre un probleme.

François


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2658
Inscription: Lun Mai 03, 2004 14:48

Message le Sam Oct 23, 2004 20:32

Suede a écrit:Le probleme est que même sans être visitée, la page est indexée et apparait sur des recherches. Dans mon cas, ce n'est pas un probleme, mais dans d'autres cas, si le nom du fichier est plus explicite, ca peut etre un probleme.


Voir -http://www.google.fr/intl/fr/webmasters/3.html#B2 pour un peu plus d'info. Pas de solution avec robots.txt, mais bien avec les tags META:

<META NAME="ROBOTS" CONTENT="NOINDEX"> empêche l'indexation de la page.

<META NAME="ROBOTS" CONTENT="NOARCHIVE"> empêche la mise en cache de la page.

<META NAME="ROBOTS" CONTENT="NOFOLLOW"> empêche de suivre les liens de la page.

Jean-Luc


Gromka
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 124
Inscription: Dim Oct 10, 2004 10:47

Message le Dim Oct 24, 2004 1:32

À mon avis, si Google ne montre que l'URL, la page n'est pas indexée.


Suede
WRInaute accro
WRInaute accro
 
Messages: 3721
Inscription: Ven Oct 04, 2002 11:22

Message le Dim Oct 24, 2004 15:56

Ca dépend ce qu'on apelle indexation. Pour moi indexation = présente dans la base et ressortant sur une requete de google. Après que l'indexation soit faite sur le contenu ou uniquement le nom de fichier, c'est autre chose.

François


Gromka
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 124
Inscription: Dim Oct 10, 2004 10:47

Message le Dim Oct 24, 2004 16:45

Mais, je crois, que l'importance pour la visibilité d'une certaine web c'est nule. Ces 'indexations' sont uniquement outiles pour la gestion du site. Ca veut dire, pour nous, les fous (webmasters). :lol:


LoopingMax
WRInaute discret
WRInaute discret
 
Messages: 82
Inscription: Ven Nov 12, 2004 10:29

Message le Mer Jan 19, 2005 11:06

jeanluc a écrit:<META NAME="ROBOTS" CONTENT="NOINDEX"> empêche l'indexation de la page.
<META NAME="ROBOTS" CONTENT="NOARCHIVE"> empêche la mise en cache de la page.
<META NAME="ROBOTS" CONTENT="NOFOLLOW"> empêche de suivre les liens de la page.


Peux-t-on mettre :

meta name="robots" content="index,follow,all,noarchive"

ou faut-il mettre :

meta name="robots" content="index"
meta name="robots" content="follow"
meta name="robots" content="all"
meta name="robots" content="noarchive"

Merci.


Gromka
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 124
Inscription: Dim Oct 10, 2004 10:47

Message le Mar Fév 01, 2005 2:22

On peut

meta name="robots" content="index,follow,all,noarchive"

http://www.robotstxt.org/wc/exclusion.html#meta

<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités