Fichier robots.txt
10 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Fichier robots.txt
Bonjour,
Je viens de voir que malgré mon fichier robots.txt http://www.photos-suede.com/robots.txt
Je suis quans même dans Google :
http://www.google.fr/search?as_q=&num=1 ... itesearch=
Le fichier est là depuis mars.
A priori, il respecte le standard du fichier robots.txt ( http://www.webrankinfo.com/outils/robots/faq_15_113.htm par exemple)
D'autres cas ?
François
Je viens de voir que malgré mon fichier robots.txt http://www.photos-suede.com/robots.txt
- Code: Tout sélectionner
User-agent: *
Disallow: /forum/login.php
Disallow: /forum/modcp.php
Disallow: /forum/posting.php
Disallow: /forum/printview.php
Disallow: /forum/privmsg.php
Disallow: /forum/search.php
Disallow: /forum/viewonline.php
Je suis quans même dans Google :
http://www.google.fr/search?as_q=&num=1 ... itesearch=
Le fichier est là depuis mars.
A priori, il respecte le standard du fichier robots.txt ( http://www.webrankinfo.com/outils/robots/faq_15_113.htm par exemple)
D'autres cas ?
François
Re: Fichier robots.txt
Bonjour Suede,
La réponse est que ton robots.txt interdit à Google de lire /forum/login.php et Google respecte cette interdiction.
Par contre, dans d'autres pages dont tu autorises la visite, il trouve des liens vers /forum/login.php et, sans visiter la page, il en connaît l'existence. C'est ainsi que cette page - non lue, donc sans mise en cache - se retrouve dans les résultats Google.
C'est contrariant, mais logique ...
Jean-Luc
La réponse est que ton robots.txt interdit à Google de lire /forum/login.php et Google respecte cette interdiction.
Par contre, dans d'autres pages dont tu autorises la visite, il trouve des liens vers /forum/login.php et, sans visiter la page, il en connaît l'existence. C'est ainsi que cette page - non lue, donc sans mise en cache - se retrouve dans les résultats Google.
C'est contrariant, mais logique ...
Jean-Luc
Oui,
Le standard parle de visite mais google utilise les termes visites et index quand ils parlent de meta et robots.
Le probleme est que même sans être visitée, la page est indexée et apparait sur des recherches. Dans mon cas, ce n'est pas un probleme, mais dans d'autres cas, si le nom du fichier est plus explicite, ca peut etre un probleme.
François
Le standard parle de visite mais google utilise les termes visites et index quand ils parlent de meta et robots.
Le probleme est que même sans être visitée, la page est indexée et apparait sur des recherches. Dans mon cas, ce n'est pas un probleme, mais dans d'autres cas, si le nom du fichier est plus explicite, ca peut etre un probleme.
François
Suede a écrit:Le probleme est que même sans être visitée, la page est indexée et apparait sur des recherches. Dans mon cas, ce n'est pas un probleme, mais dans d'autres cas, si le nom du fichier est plus explicite, ca peut etre un probleme.
Voir -http://www.google.fr/intl/fr/webmasters/3.html#B2 pour un peu plus d'info. Pas de solution avec robots.txt, mais bien avec les tags META:
<META NAME="ROBOTS" CONTENT="NOINDEX"> empêche l'indexation de la page.
<META NAME="ROBOTS" CONTENT="NOARCHIVE"> empêche la mise en cache de la page.
<META NAME="ROBOTS" CONTENT="NOFOLLOW"> empêche de suivre les liens de la page.
Jean-Luc
Ca dépend ce qu'on apelle indexation. Pour moi indexation = présente dans la base et ressortant sur une requete de google. Après que l'indexation soit faite sur le contenu ou uniquement le nom de fichier, c'est autre chose.
François
François
-

LoopingMax - WRInaute discret

- Messages: 82
- Inscription: Ven Nov 12, 2004 10:29
jeanluc a écrit:<META NAME="ROBOTS" CONTENT="NOINDEX"> empêche l'indexation de la page.
<META NAME="ROBOTS" CONTENT="NOARCHIVE"> empêche la mise en cache de la page.
<META NAME="ROBOTS" CONTENT="NOFOLLOW"> empêche de suivre les liens de la page.
Peux-t-on mettre :
meta name="robots" content="index,follow,all,noarchive"
ou faut-il mettre :
meta name="robots" content="index"
meta name="robots" content="follow"
meta name="robots" content="all"
meta name="robots" content="noarchive"
Merci.
On peut
meta name="robots" content="index,follow,all,noarchive"
http://www.robotstxt.org/wc/exclusion.html#meta
meta name="robots" content="index,follow,all,noarchive"
http://www.robotstxt.org/wc/exclusion.html#meta
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
10 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Sortie de GoogleStats v2.01
- Déclarer son fichier sitemap dans le fichier robots.txt
- Robots.txt : Yahoo supporte les options avancées
- Comment gérer simplement les sitemaps de plusieurs sites au même endroit
- Petit changement pour Slurp (le robot de Yahoo)
- Exalead rejoint le protocole Sitemaps.org
- Article sur le fichier .htaccess
- Les crawlers de Yahoo!
- Yahoo Audio Search
- Les robots MSNbot de Live Search
- probleme avec fichier robots.txt fichier bloquer
- Erreurs Robots.txt sans fichier Robots.txt
- Fichier robots efficace?
- Fichier robots txt
- fichier robots.txt
- Indexation du fichier robots.txt
- Utilisation du fichier robots.txt
- Contenu du fichier robots.txt
- protéger le fichier robots.txt
- Creer un fichier robots.txt?
- Où placer le fichier robots.txt ?
- Wikio et son fichier robots.txt
- [RESOLU] difference fichier robots et htaccess ?
- Index google et fichier robots.txt ?
- problème avec le fichier robots.txt
Consultez la description détaillée des produits ou services de Google suivants : Google Feed Fetcher, Google Sitemaps
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités






le forum