Interdire des pages dynamiques dans robots.txt
Règles du forum
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !
Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !
Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).
3 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- Galdon
- WRInaute discret

- Messages: 79
- Inscription: 19 Déc 2007
Interdire des pages dynamiques dans robots.txt
Bonjour,
En regardant mes logs, je me suis aperçu que Googlebot explore énormément de pages (plusieurs centaines/jour, presque un millier) sans intérêt sur mon forum phpBB, comme la liste des membres.
Voici un échantillon des URL visitées :
Je souhaite interdire ces pages aux robots avec le fichier robots.txt.
A ma connaissance, la règle Disallow ne permet d'exclure que des repertoires ou des fichiers spécifiques.
Dans mon cas, il n'y a pas d'URL précise puisque memberlist.php est une page dynamique qui prend pas mal de paramètres GET donc ça fait un nombre d'URL différentes monstrueux.
Et ce que si je mets ce code dans robots.txt ça va marcher, peu importe les paramètres en URL :
?
Merci
En regardant mes logs, je me suis aperçu que Googlebot explore énormément de pages (plusieurs centaines/jour, presque un millier) sans intérêt sur mon forum phpBB, comme la liste des membres.
Voici un échantillon des URL visitées :
/memberlist.php?sk=c&sd=d&first_char=j&first_char=
/memberlist.php?sk=c&sd=d&first_char=f&first_char=n
/memberlist.php?sk=c&sd=d&first_char=j&first_char=z
/memberlist.php?sk=c&sd=d&first_char&mode=searchuser&start=500
/memberlist.php?sk=m&sd=d&mode=searchuser&start=500
/memberlist.php?sk=c&sd=d&first_char=l&first_char=w
/memberlist.php?mode=searchuser&start=675&sk=a&sd=d&first_char
/memberlist.php?sk=c&sd=d&first_char=k&first_char=m
/memberlist.php?sk=d&sd=d&mode=searchuser&start=500
/memberlist.php?sk=a&sd=d&first_char&start=400
Je souhaite interdire ces pages aux robots avec le fichier robots.txt.
A ma connaissance, la règle Disallow ne permet d'exclure que des repertoires ou des fichiers spécifiques.
Dans mon cas, il n'y a pas d'URL précise puisque memberlist.php est une page dynamique qui prend pas mal de paramètres GET donc ça fait un nombre d'URL différentes monstrueux.
Et ce que si je mets ce code dans robots.txt ça va marcher, peu importe les paramètres en URL :
- Code: Tout sélectionner
User-agent: *
Disallow: /memberlist.php
?
Merci
-

YoyoS - WRInaute accro

- Messages: 3835
- Inscription: 14 Sep 2006
Re: Interdire des pages dynamiques dans robots.txt
Oui tout à fait. Il ignorera complètement tout URI qui commence par "/memberlist.php"
Tu peux même être plus précis, si tu ne veux pas désindexer la page sans paramètres avec Disallow: /memberlist.php?
Tu peux même être plus précis, si tu ne veux pas désindexer la page sans paramètres avec Disallow: /memberlist.php?
3 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Comment interdire le référencement de pages dynamiques
- Interdire certains robots ? Comment ? Quels robots ?
- robots txt et pages dynamiques
- robots.txt et pages dynamiques
- Interdire l'acces au fichier Robots
- Faut-il interdire certains robots ?
- Interdire aspirateur et bot via le robots.txt
- Problème pour effacer pages dynamiques avec robots.txt
- utilisation de robots.txt pour bloquer les pages dynamiques
- Robots.txt interdire une url dynamique
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité
