Robots.txt - Disallow pour des pages avec paramètre
5 messages • Page 1 sur 1
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
-

biddybulle - WRInaute accro

- Messages: 1470
- Inscription: Lun Mai 30, 2005 21:55
Robots.txt - Disallow pour des pages avec paramètre
A déplacer dans la bonne rubrique, me suis tromper
Comment désactivé le passage de robots qui parcourait des pages avec toujour le même paramètre du genre
/index/sous_dossier_truc/?parametre=
/index/sous_dossier_bidule/sous_dossier_machin/?parametre=
tout cela par millier
La question est donc : Est ce que cette règle est convenable et s'appliquera sur tous les dossiers et l'arbo du site.
User-Agent: *
Disallow: ?parametre
Comment désactivé le passage de robots qui parcourait des pages avec toujour le même paramètre du genre
/index/sous_dossier_truc/?parametre=
/index/sous_dossier_bidule/sous_dossier_machin/?parametre=
tout cela par millier
La question est donc : Est ce que cette règle est convenable et s'appliquera sur tous les dossiers et l'arbo du site.
User-Agent: *
Disallow: ?parametre
Tu peux utiliser ça:
(empêche l'indexation des pages contenant un "?")
Mais ce n'est pas une instruction standard, et il n'y a que GoogleBot qui la reconnaisse.
Ou ça :
empêche l'indexation des URL contenant la chaîne "parametre"
Mais c'est pareil, c'est pas standard et je crois que seul GoogleBot en tient compte.
(faudrait demander à Jean-Luc)
- Code: Tout sélectionner
Disallow: /*?
(empêche l'indexation des pages contenant un "?")
Mais ce n'est pas une instruction standard, et il n'y a que GoogleBot qui la reconnaisse.
Ou ça :
- Code: Tout sélectionner
Disallow: /*parametre
empêche l'indexation des URL contenant la chaîne "parametre"
Mais c'est pareil, c'est pas standard et je crois que seul GoogleBot en tient compte.
(faudrait demander à Jean-Luc)
-

biddybulle - WRInaute accro

- Messages: 1470
- Inscription: Lun Mai 30, 2005 21:55
Merci bon je vais déjà testé avec ceci.
Monty973 a écrit:Mais ce n'est pas une instruction standard, et il n'y a que GoogleBot qui la reconnaisse.
Il n'y a pas que Google : avant que GG ne l'adopte il y avait déjà MSN.
-http://www.amaryllidaceae.org/web-jardin/fichier/robots-txt.htm#exp
Amaryllid a écrit:Monty973 a écrit:Mais ce n'est pas une instruction standard, et il n'y a que GoogleBot qui la reconnaisse.
Il n'y a pas que Google : avant que GG ne l'adopte il y avait déjà MSN.
-http://www.amaryllidaceae.org/web-jardin/fichier/robots-txt.htm#exp
Oui mais MSN permet son utilisation pour empécher l'indexation de fichiers ayant une extension particulière, je ne suis pas sûr que ce type de syntaxe puisse être utilisé de manière aussi large que dans le cas de Google.
- Code: Tout sélectionner
User-agent: MSNBot
Disallow: /*.[extension de fichier]$
(le symbole du dollar « $ » est obligatoire)
User-agent: MSNBot
Disallow: /*.PDF$
Disallow: /*.jpeg$
Disallow: /*.exe$
http://search.msn.fr/docs/siteowner.asp ... ToSite.htm
5 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par Julien Coquet, expert certifié officiellement par Google Analytics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Robots.txt : Yahoo supporte les options avancées
- Sortie de GoogleStats v2.01
- Les crawlers de Yahoo!
- Gérer ses paramètres de tracking dans Google Webmaster Tools
- Les robots MSNbot de Live Search
- Déclarer son fichier sitemap dans le fichier robots.txt
- Petit changement pour Slurp (le robot de Yahoo)
- Référencement d'un forum phpBB
- La balise meta NOYDIR de Yahoo
- Comment gérer simplement les sitemaps de plusieurs sites au même endroit
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités



le forum