Robots.txt - Disallow pour des pages avec paramètre

Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics


biddybulle
WRInaute accro
WRInaute accro
 
Messages: 1470
Inscription: Lun Mai 30, 2005 21:55

Robots.txt - Disallow pour des pages avec paramètre

Message le Ven Oct 20, 2006 11:05

A déplacer dans la bonne rubrique, me suis tromper

Comment désactivé le passage de robots qui parcourait des pages avec toujour le même paramètre du genre

/index/sous_dossier_truc/?parametre=
/index/sous_dossier_bidule/sous_dossier_machin/?parametre=

tout cela par millier

La question est donc : Est ce que cette règle est convenable et s'appliquera sur tous les dossiers et l'arbo du site.

User-Agent: *
Disallow: ?parametre


Monty973
WRInaute accro
WRInaute accro
 
Messages: 1614
Inscription: Mar Mar 21, 2006 4:52

Message le Ven Oct 20, 2006 13:04

Tu peux utiliser ça:

Code: Tout sélectionner
Disallow: /*?


(empêche l'indexation des pages contenant un "?")

Mais ce n'est pas une instruction standard, et il n'y a que GoogleBot qui la reconnaisse.

Ou ça :

Code: Tout sélectionner
Disallow: /*parametre


empêche l'indexation des URL contenant la chaîne "parametre"

Mais c'est pareil, c'est pas standard et je crois que seul GoogleBot en tient compte.

(faudrait demander à Jean-Luc) :D


biddybulle
WRInaute accro
WRInaute accro
 
Messages: 1470
Inscription: Lun Mai 30, 2005 21:55

Message le Ven Oct 20, 2006 13:19

Merci bon je vais déjà testé avec ceci.

Amaryllid
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 165
Inscription: Ven Avr 08, 2005 23:03

Message le Sam Oct 21, 2006 21:08

Monty973 a écrit:Mais ce n'est pas une instruction standard, et il n'y a que GoogleBot qui la reconnaisse.

Il n'y a pas que Google : avant que GG ne l'adopte il y avait déjà MSN.
-http://www.amaryllidaceae.org/web-jardin/fichier/robots-txt.htm#exp


Monty973
WRInaute accro
WRInaute accro
 
Messages: 1614
Inscription: Mar Mar 21, 2006 4:52

Message le Sam Oct 21, 2006 21:40

Amaryllid a écrit:
Monty973 a écrit:Mais ce n'est pas une instruction standard, et il n'y a que GoogleBot qui la reconnaisse.

Il n'y a pas que Google : avant que GG ne l'adopte il y avait déjà MSN.
-http://www.amaryllidaceae.org/web-jardin/fichier/robots-txt.htm#exp


Oui mais MSN permet son utilisation pour empécher l'indexation de fichiers ayant une extension particulière, je ne suis pas sûr que ce type de syntaxe puisse être utilisé de manière aussi large que dans le cas de Google.

Code: Tout sélectionner
User-agent: MSNBot
Disallow: /*.[extension de fichier]$

(le symbole du dollar « $ » est obligatoire)   

User-agent: MSNBot
Disallow: /*.PDF$
Disallow: /*.jpeg$
Disallow: /*.exe$


http://search.msn.fr/docs/siteowner.asp ... ToSite.htm


Formation recommandée sur ce thème :

Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par Julien Coquet, expert certifié officiellement par Google Analytics.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités