Fichier robots.txt

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics


Suede
WRInaute accro
WRInaute accro
 
Messages: 3722
Inscription: 4 Oct 2002

Fichier robots.txt

Message le Sam Oct 23, 2004 18:17

Bonjour,

Je viens de voir que malgré mon fichier robots.txt http://www.photos-suede.com/robots.txt
Code: Tout sélectionner
User-agent:  *
Disallow: /forum/login.php
Disallow: /forum/modcp.php
Disallow: /forum/posting.php
Disallow: /forum/printview.php
Disallow: /forum/privmsg.php
Disallow: /forum/search.php
Disallow: /forum/viewonline.php


Je suis quans même dans Google :
http://www.google.fr/search?as_q=&num=1 ... itesearch=

Le fichier est là depuis mars.

A priori, il respecte le standard du fichier robots.txt ( http://www.webrankinfo.com/outils/robots/faq_15_113.htm par exemple)

D'autres cas ?

François

Jeromeb
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 263
Inscription: 4 Oct 2004

Message le Sam Oct 23, 2004 18:24

Suède,

Oui, ça arrive souvent ces temps ci. Il parait qu'un nouveau robot** Google est arrivé, il est peut être mal configuré.

** peut être une robote vu le résultat du mot clé Jaimemaboite ; conférer ancien message


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3049
Inscription: 3 Mai 2004

Re: Fichier robots.txt

Message le Sam Oct 23, 2004 19:21

Bonjour Suede,

La réponse est que ton robots.txt interdit à Google de lire /forum/login.php et Google respecte cette interdiction.

Par contre, dans d'autres pages dont tu autorises la visite, il trouve des liens vers /forum/login.php et, sans visiter la page, il en connaît l'existence. C'est ainsi que cette page - non lue, donc sans mise en cache - se retrouve dans les résultats Google.

C'est contrariant, mais logique ... :wink:

Jean-Luc


Suede
WRInaute accro
WRInaute accro
 
Messages: 3722
Inscription: 4 Oct 2002

Message le Sam Oct 23, 2004 20:09

Oui,
Le standard parle de visite mais google utilise les termes visites et index quand ils parlent de meta et robots.
Le probleme est que même sans être visitée, la page est indexée et apparait sur des recherches. Dans mon cas, ce n'est pas un probleme, mais dans d'autres cas, si le nom du fichier est plus explicite, ca peut etre un probleme.

François


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3049
Inscription: 3 Mai 2004

Message le Sam Oct 23, 2004 20:32

Suede a écrit:Le probleme est que même sans être visitée, la page est indexée et apparait sur des recherches. Dans mon cas, ce n'est pas un probleme, mais dans d'autres cas, si le nom du fichier est plus explicite, ca peut etre un probleme.


Voir -http://www.google.fr/intl/fr/webmasters/3.html#B2 pour un peu plus d'info. Pas de solution avec robots.txt, mais bien avec les tags META:

<META NAME="ROBOTS" CONTENT="NOINDEX"> empêche l'indexation de la page.

<META NAME="ROBOTS" CONTENT="NOARCHIVE"> empêche la mise en cache de la page.

<META NAME="ROBOTS" CONTENT="NOFOLLOW"> empêche de suivre les liens de la page.

Jean-Luc

Gromka
WRInaute discret
WRInaute discret
 
Messages: 124
Inscription: 10 Oct 2004

Message le Dim Oct 24, 2004 1:32

À mon avis, si Google ne montre que l'URL, la page n'est pas indexée.


Suede
WRInaute accro
WRInaute accro
 
Messages: 3722
Inscription: 4 Oct 2002

Message le Dim Oct 24, 2004 15:56

Ca dépend ce qu'on apelle indexation. Pour moi indexation = présente dans la base et ressortant sur une requete de google. Après que l'indexation soit faite sur le contenu ou uniquement le nom de fichier, c'est autre chose.

François

Gromka
WRInaute discret
WRInaute discret
 
Messages: 124
Inscription: 10 Oct 2004

Message le Dim Oct 24, 2004 16:45

Mais, je crois, que l'importance pour la visibilité d'une certaine web c'est nule. Ces 'indexations' sont uniquement outiles pour la gestion du site. Ca veut dire, pour nous, les fous (webmasters). :lol:


LoopingMax
WRInaute discret
WRInaute discret
 
Messages: 94
Inscription: 12 Nov 2004

Message le Mer Jan 19, 2005 11:06

jeanluc a écrit:<META NAME="ROBOTS" CONTENT="NOINDEX"> empêche l'indexation de la page.
<META NAME="ROBOTS" CONTENT="NOARCHIVE"> empêche la mise en cache de la page.
<META NAME="ROBOTS" CONTENT="NOFOLLOW"> empêche de suivre les liens de la page.


Peux-t-on mettre :

meta name="robots" content="index,follow,all,noarchive"

ou faut-il mettre :

meta name="robots" content="index"
meta name="robots" content="follow"
meta name="robots" content="all"
meta name="robots" content="noarchive"

Merci.

Gromka
WRInaute discret
WRInaute discret
 
Messages: 124
Inscription: 10 Oct 2004

Message le Mar Fév 01, 2005 2:22

On peut

meta name="robots" content="index,follow,all,noarchive"

http://www.robotstxt.org/wc/exclusion.html#meta

<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités