Bloquer l'accés à des "sous-liens" en utilisant robots.txt
8 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- Melimode
- Nouveau WRInaute

- Messages: 8
- Inscription: 8 Mai 2008
Bloquer l'accés à des "sous-liens" en utilisant robots.txt
Bonjour,
Je voudrai empêcher les robots (et principalement Google) de lire certaines pages de mon site. Habituellement j’utilise cette fonction dans le fichier robots.txt du site : Disallow: /contact_us.php
MAIS ! Permettez-moi de vous exposer un peu plus en détail le problème :
Sur mon site (oscommerce), j’ai des rayons comme celui-ci : http://www.monsite.fr/chemises-c-2.html et lorsque l’on clique sur le lien chemise par exemple, j’ai d’autres « sous-liens » qui s’affiche afin de permettre les clients de visualiser les chemises disponibles dans leur taille :
Taille 36 ( http://www.monsite.fr/chemises-c-2.html?sizeRange=1 )
Taille 38 ( http://www.monsite.fr/chemises-c-2.html?sizeRange=2 )
Taille 40 etc… ( http://www.monsite.fr/chemises-c-2.html?sizeRange=3 )
Du coup, dans mon interface de « Google gestion Webmaster », google m’indique que j’ai des balises titles et meta en double, car effectivement le même article peu s’afficher dans plusieurs taille.
Pou faire simple je voudrai donc autoriser google à n’aller QUE dans le rayon principal des chemises, (car ce rayon affiche déjà toutes les tailles disponibles http://www.monsite.fr/chemises-c-2.html) et l’EMPECHER d’aller dans les sous-rayons de tailles qui comporte donc une variable « sizeRange ».
Est-ce que je peu donc simplement indiquer ceci dans mon fichier robots.txt :
Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange=1
Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange=2
Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange=3
Ect .. ?
Mais est ce que ceci ne va pas bloquer l’accès au lien http://www.monsite.fr/chemises-c-2.html ?
Et dans le cas ou cela est possible, dois-je indiquer autant de « Disallow: » que j’ai de taille dans « sizeRange » ?
J’espère que j’ai été assez clair dans la description de mon problème, et je vous souhaite à tous une agréable journée.
Je voudrai empêcher les robots (et principalement Google) de lire certaines pages de mon site. Habituellement j’utilise cette fonction dans le fichier robots.txt du site : Disallow: /contact_us.php
MAIS ! Permettez-moi de vous exposer un peu plus en détail le problème :
Sur mon site (oscommerce), j’ai des rayons comme celui-ci : http://www.monsite.fr/chemises-c-2.html et lorsque l’on clique sur le lien chemise par exemple, j’ai d’autres « sous-liens » qui s’affiche afin de permettre les clients de visualiser les chemises disponibles dans leur taille :
Taille 36 ( http://www.monsite.fr/chemises-c-2.html?sizeRange=1 )
Taille 38 ( http://www.monsite.fr/chemises-c-2.html?sizeRange=2 )
Taille 40 etc… ( http://www.monsite.fr/chemises-c-2.html?sizeRange=3 )
Du coup, dans mon interface de « Google gestion Webmaster », google m’indique que j’ai des balises titles et meta en double, car effectivement le même article peu s’afficher dans plusieurs taille.
Pou faire simple je voudrai donc autoriser google à n’aller QUE dans le rayon principal des chemises, (car ce rayon affiche déjà toutes les tailles disponibles http://www.monsite.fr/chemises-c-2.html) et l’EMPECHER d’aller dans les sous-rayons de tailles qui comporte donc une variable « sizeRange ».
Est-ce que je peu donc simplement indiquer ceci dans mon fichier robots.txt :
Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange=1
Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange=2
Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange=3
Ect .. ?
Mais est ce que ceci ne va pas bloquer l’accès au lien http://www.monsite.fr/chemises-c-2.html ?
Et dans le cas ou cela est possible, dois-je indiquer autant de « Disallow: » que j’ai de taille dans « sizeRange » ?
J’espère que j’ai été assez clair dans la description de mon problème, et je vous souhaite à tous une agréable journée.
-

Marie-Aude - Modérateur

- Messages: 11870
- Inscription: 5 Juin 2006
Re: Bloquer l'accés à des "sous-liens" en utilisant robots.txt
Tu peux mettre un joker
Disallow: /http://www.monsite.fr/chemises-c-2.html?* ou
Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange*
Disallow: /http://www.monsite.fr/chemises-c-2.html?* ou
Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange*
- Melimode
- Nouveau WRInaute

- Messages: 8
- Inscription: 8 Mai 2008
Re: Bloquer l'accés à des "sous-liens" en utilisant robots.txt
Marie-Aude a écrit:Tu peux mettre un joker
Disallow: /http://www.monsite.fr/chemises-c-2.html?* ou
Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange*
Dans le cas du "Joker" http://www.monsite.fr/chemises-c-2.html?sizeRange* les robots ont toujours bien accés à la page : http://www.monsite.fr/chemises-c-2.html ?
Si oui, et bien je te remerçie Marie-Aude pour cette information.
Bonne journée à tous.
-

Marie-Aude - Modérateur

- Messages: 11870
- Inscription: 5 Juin 2006
Re: Bloquer l'accés à des "sous-liens" en utilisant robots.txt
Oui, puisque ce n'est pas la même url . Et en cas de doute tu peux vérifier ton fichier dans GWT et tester des urls
-

cedric_g - WRInaute accro

- Messages: 3552
- Inscription: 18 Jan 2006
Re: Bloquer l'accés à des "sous-liens" en utilisant robots.txt
Bonjour
Il faudra qu'un jour je me mette sérieusement à étudier le robots.txt (je n'en connais que les bases...) ; par contre avec cette méthode, cela sous-entend de gérer chaque page d'article avec des tailles séparément ?
Ou y'a moyen d'inclure un "joker" pour les articles ?
Sur les sites e-commerce que je gère je procède différemment : détection de la présence des variables "indésirables" (elles sont lisibles en PHP) et le cas échéant, notification pour positionner la balise META Robots à "noindex,follow".
Fonctionne plutôt bien.
Il faudra qu'un jour je me mette sérieusement à étudier le robots.txt (je n'en connais que les bases...) ; par contre avec cette méthode, cela sous-entend de gérer chaque page d'article avec des tailles séparément ?
Ou y'a moyen d'inclure un "joker" pour les articles ?
Sur les sites e-commerce que je gère je procède différemment : détection de la présence des variables "indésirables" (elles sont lisibles en PHP) et le cas échéant, notification pour positionner la balise META Robots à "noindex,follow".
Fonctionne plutôt bien.
-

Marie-Aude - Modérateur

- Messages: 11870
- Inscription: 5 Juin 2006
Re: Bloquer l'accés à des "sous-liens" en utilisant robots.txt
Tu peux inclure un joker,si tu vas voir sur mon site j'avais fait un article sur le robots.txt des sites wordpress si c'est pour toi.
- Melimode
- Nouveau WRInaute

- Messages: 8
- Inscription: 8 Mai 2008
Re: Bloquer l'accés à des "sous-liens" en utilisant robots.txt
HawkEye a écrit:Sinon il est aussi possible de vérifier si $_GET['sizeRange'] est renseigné, et d'envoyer un <meta name="robots" content="noindex" />.
Merci,
J'ai donc retenu 2 méthodes efficaces pour régler mon problème de multiple-référencement :
1) Celle citée ci-dessus.
2) Et la méthode joker (Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange*).
L'une de ces solutions est-elle plus "Propre, ou conventionnelle" que l'autre ou est-ce la même chose aux yeux de GoOgle ?
Encore une fois, merci pour vos conseils.
8 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- robots.txt incapable de bloquer ces robots :
- bloquer un acces wifi parasite.
- HELP bloquer l accès à mon hébergement
- [résolu] bloquer accès suivant http-referer
- Bloquer tout acces d'un site referent proprement
- Menu utilisant un fichier ".js" et indexation
- Robots et la balise..."Robots"CONTENT="index,
- délai de prise en compte du <meta name="robots" content="none" /> pour pages déjà indéxées
- URGENT : <meta name="robots" content="noindex,follow" /> et Google m'indexe mes pages !
- Bloquer robots sans en-têtes
Consultez la description détaillée des produits ou services de Google suivants : Google AdWords
- Partenaires pour échanges de liens
Cet outil vous liste quelques sites qui font des liens vers des sites similaires au vôtre, pour vous aider à trouver des partenaires pour des échanges de liens. - Calcul du taux de liens vers des pages internes
Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés. - Analyse des backlinks
Cet outil vous permet d'analyser en détails la "popularité" de votre site sur Google. En plus du nombre de liens pris en compte par Google, il calcule le pourcentage de liens internes parmi tous les liens, et il affiche les premières URL trouvées. - Recherche de citations d'un site en texte brut
Cet outil vous permet de trouver des pages citant votre site mais ne faisant pas (encore) de lien. Il suffira parfois d'un simple mail pour transformer cette simple citation en lien (backlink).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité
