Fichier robots.txt
10 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

Suede - WRInaute accro

- Messages: 3722
- Inscription: 4 Oct 2002
Fichier robots.txt
Bonjour,
Je viens de voir que malgré mon fichier robots.txt http://www.photos-suede.com/robots.txt
Je suis quans même dans Google :
http://www.google.fr/search?as_q=&num=1 ... itesearch=
Le fichier est là depuis mars.
A priori, il respecte le standard du fichier robots.txt ( http://www.webrankinfo.com/outils/robots/faq_15_113.htm par exemple)
D'autres cas ?
François
Je viens de voir que malgré mon fichier robots.txt http://www.photos-suede.com/robots.txt
- Code: Tout sélectionner
User-agent: *
Disallow: /forum/login.php
Disallow: /forum/modcp.php
Disallow: /forum/posting.php
Disallow: /forum/printview.php
Disallow: /forum/privmsg.php
Disallow: /forum/search.php
Disallow: /forum/viewonline.php
Je suis quans même dans Google :
http://www.google.fr/search?as_q=&num=1 ... itesearch=
Le fichier est là depuis mars.
A priori, il respecte le standard du fichier robots.txt ( http://www.webrankinfo.com/outils/robots/faq_15_113.htm par exemple)
D'autres cas ?
François
-

jeanluc - WRInaute accro

- Messages: 3049
- Inscription: 3 Mai 2004
Re: Fichier robots.txt
Bonjour Suede,
La réponse est que ton robots.txt interdit à Google de lire /forum/login.php et Google respecte cette interdiction.
Par contre, dans d'autres pages dont tu autorises la visite, il trouve des liens vers /forum/login.php et, sans visiter la page, il en connaît l'existence. C'est ainsi que cette page - non lue, donc sans mise en cache - se retrouve dans les résultats Google.
C'est contrariant, mais logique ...
Jean-Luc
La réponse est que ton robots.txt interdit à Google de lire /forum/login.php et Google respecte cette interdiction.
Par contre, dans d'autres pages dont tu autorises la visite, il trouve des liens vers /forum/login.php et, sans visiter la page, il en connaît l'existence. C'est ainsi que cette page - non lue, donc sans mise en cache - se retrouve dans les résultats Google.
C'est contrariant, mais logique ...
Jean-Luc
-

Suede - WRInaute accro

- Messages: 3722
- Inscription: 4 Oct 2002
Oui,
Le standard parle de visite mais google utilise les termes visites et index quand ils parlent de meta et robots.
Le probleme est que même sans être visitée, la page est indexée et apparait sur des recherches. Dans mon cas, ce n'est pas un probleme, mais dans d'autres cas, si le nom du fichier est plus explicite, ca peut etre un probleme.
François
Le standard parle de visite mais google utilise les termes visites et index quand ils parlent de meta et robots.
Le probleme est que même sans être visitée, la page est indexée et apparait sur des recherches. Dans mon cas, ce n'est pas un probleme, mais dans d'autres cas, si le nom du fichier est plus explicite, ca peut etre un probleme.
François
-

jeanluc - WRInaute accro

- Messages: 3049
- Inscription: 3 Mai 2004
Suede a écrit:Le probleme est que même sans être visitée, la page est indexée et apparait sur des recherches. Dans mon cas, ce n'est pas un probleme, mais dans d'autres cas, si le nom du fichier est plus explicite, ca peut etre un probleme.
Voir -http://www.google.fr/intl/fr/webmasters/3.html#B2 pour un peu plus d'info. Pas de solution avec robots.txt, mais bien avec les tags META:
<META NAME="ROBOTS" CONTENT="NOINDEX"> empêche l'indexation de la page.
<META NAME="ROBOTS" CONTENT="NOARCHIVE"> empêche la mise en cache de la page.
<META NAME="ROBOTS" CONTENT="NOFOLLOW"> empêche de suivre les liens de la page.
Jean-Luc
-

LoopingMax - WRInaute discret

- Messages: 94
- Inscription: 12 Nov 2004
jeanluc a écrit:<META NAME="ROBOTS" CONTENT="NOINDEX"> empêche l'indexation de la page.
<META NAME="ROBOTS" CONTENT="NOARCHIVE"> empêche la mise en cache de la page.
<META NAME="ROBOTS" CONTENT="NOFOLLOW"> empêche de suivre les liens de la page.
Peux-t-on mettre :
meta name="robots" content="index,follow,all,noarchive"
ou faut-il mettre :
meta name="robots" content="index"
meta name="robots" content="follow"
meta name="robots" content="all"
meta name="robots" content="noarchive"
Merci.
- Gromka
- WRInaute discret

- Messages: 124
- Inscription: 10 Oct 2004
On peut
meta name="robots" content="index,follow,all,noarchive"
http://www.robotstxt.org/wc/exclusion.html#meta
meta name="robots" content="index,follow,all,noarchive"
http://www.robotstxt.org/wc/exclusion.html#meta
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
10 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- probleme avec fichier robots.txt fichier bloquer
- Fichier robots.txt VS balise meta robots
- Erreurs Robots.txt sans fichier Robots.txt
- Fichier robots efficace?
- Fichier robots txt
- fichier robots.txt
- expressions régulieres et fichier robots
- fichier robots.txt optimal
- Limites du fichier robots.txt
- erreurs Fichier Robots.txt
Consultez la description détaillée des produits ou services de Google suivants : Google Feed Fetcher, Google Sitemaps
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

