Bloquer l'accés à des "sous-liens" en utilisant robots.txt

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

Melimode
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 8
Inscription: 8 Mai 2008

Bloquer l'accés à des "sous-liens" en utilisant robots.txt

Message le Jeu Mar 05, 2009 12:31

Bonjour,

Je voudrai empêcher les robots (et principalement Google) de lire certaines pages de mon site. Habituellement j’utilise cette fonction dans le fichier robots.txt du site : Disallow: /contact_us.php

MAIS ! Permettez-moi de vous exposer un peu plus en détail le problème :

Sur mon site (oscommerce), j’ai des rayons comme celui-ci : http://www.monsite.fr/chemises-c-2.html et lorsque l’on clique sur le lien chemise par exemple, j’ai d’autres « sous-liens » qui s’affiche afin de permettre les clients de visualiser les chemises disponibles dans leur taille :

Taille 36 ( http://www.monsite.fr/chemises-c-2.html?sizeRange=1 )
Taille 38 ( http://www.monsite.fr/chemises-c-2.html?sizeRange=2 )
Taille 40 etc… ( http://www.monsite.fr/chemises-c-2.html?sizeRange=3 )

Du coup, dans mon interface de « Google gestion Webmaster », google m’indique que j’ai des balises titles et meta en double, car effectivement le même article peu s’afficher dans plusieurs taille.

Pou faire simple je voudrai donc autoriser google à n’aller QUE dans le rayon principal des chemises, (car ce rayon affiche déjà toutes les tailles disponibles http://www.monsite.fr/chemises-c-2.html) et l’EMPECHER d’aller dans les sous-rayons de tailles qui comporte donc une variable « sizeRange ».

Est-ce que je peu donc simplement indiquer ceci dans mon fichier robots.txt :

Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange=1
Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange=2
Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange=3
Ect .. ?

Mais est ce que ceci ne va pas bloquer l’accès au lien http://www.monsite.fr/chemises-c-2.html ?

Et dans le cas ou cela est possible, dois-je indiquer autant de « Disallow: » que j’ai de taille dans « sizeRange » ?

J’espère que j’ai été assez clair dans la description de mon problème, et je vous souhaite à tous une agréable journée.


Marie-Aude
Modérateur
Modérateur
 
Messages: 11870
Inscription: 5 Juin 2006

Re: Bloquer l'accés à des "sous-liens" en utilisant robots.txt

Message le Jeu Mar 05, 2009 12:42

Tu peux mettre un joker
Disallow: /http://www.monsite.fr/chemises-c-2.html?* ou
Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange*

Melimode
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 8
Inscription: 8 Mai 2008

Re: Bloquer l'accés à des "sous-liens" en utilisant robots.txt

Message le Jeu Mar 05, 2009 14:40

Marie-Aude a écrit:Tu peux mettre un joker
Disallow: /http://www.monsite.fr/chemises-c-2.html?* ou
Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange*


Dans le cas du "Joker" http://www.monsite.fr/chemises-c-2.html?sizeRange* les robots ont toujours bien accés à la page : http://www.monsite.fr/chemises-c-2.html ?

Si oui, et bien je te remerçie Marie-Aude pour cette information.
Bonne journée à tous.


Marie-Aude
Modérateur
Modérateur
 
Messages: 11870
Inscription: 5 Juin 2006

Re: Bloquer l'accés à des "sous-liens" en utilisant robots.txt

Message le Jeu Mar 05, 2009 14:44

Oui, puisque ce n'est pas la même url . Et en cas de doute tu peux vérifier ton fichier dans GWT et tester des urls


cedric_g
WRInaute accro
WRInaute accro
 
Messages: 3552
Inscription: 18 Jan 2006

Re: Bloquer l'accés à des "sous-liens" en utilisant robots.txt

Message le Jeu Mar 05, 2009 15:40

Bonjour

Il faudra qu'un jour je me mette sérieusement à étudier le robots.txt (je n'en connais que les bases...) ; par contre avec cette méthode, cela sous-entend de gérer chaque page d'article avec des tailles séparément ?

Ou y'a moyen d'inclure un "joker" pour les articles ?

Sur les sites e-commerce que je gère je procède différemment : détection de la présence des variables "indésirables" (elles sont lisibles en PHP) et le cas échéant, notification pour positionner la balise META Robots à "noindex,follow".

Fonctionne plutôt bien.


Marie-Aude
Modérateur
Modérateur
 
Messages: 11870
Inscription: 5 Juin 2006

Re: Bloquer l'accés à des "sous-liens" en utilisant robots.txt

Message le Jeu Mar 05, 2009 15:50

Tu peux inclure un joker,si tu vas voir sur mon site j'avais fait un article sur le robots.txt des sites wordpress si c'est pour toi.


HawkEye
WRInaute accro
WRInaute accro
 
Messages: 17013
Inscription: 23 Fév 2004

Re: Bloquer l'accés à des "sous-liens" en utilisant robots.txt

Message le Jeu Mar 05, 2009 17:05

Sinon il est aussi possible de vérifier si $_GET['sizeRange'] est renseigné, et d'envoyer un <meta name="robots" content="noindex" />.

Melimode
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 8
Inscription: 8 Mai 2008

Re: Bloquer l'accés à des "sous-liens" en utilisant robots.txt

Message le Ven Mar 06, 2009 9:59

HawkEye a écrit:Sinon il est aussi possible de vérifier si $_GET['sizeRange'] est renseigné, et d'envoyer un <meta name="robots" content="noindex" />.


Merci,

J'ai donc retenu 2 méthodes efficaces pour régler mon problème de multiple-référencement :

1) Celle citée ci-dessus.
2) Et la méthode joker (Disallow: /http://www.monsite.fr/chemises-c-2.html?sizeRange*).

L'une de ces solutions est-elle plus "Propre, ou conventionnelle" que l'autre ou est-ce la même chose aux yeux de GoOgle ?

Encore une fois, merci pour vos conseils.


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google AdWords

  • Partenaires pour échanges de liens
    Cet outil vous liste quelques sites qui font des liens vers des sites similaires au vôtre, pour vous aider à trouver des partenaires pour des échanges de liens.
  • Calcul du taux de liens vers des pages internes
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.
  • Analyse des backlinks
    Cet outil vous permet d'analyser en détails la "popularité" de votre site sur Google. En plus du nombre de liens pris en compte par Google, il calcule le pourcentage de liens internes parmi tous les liens, et il affiche les premières URL trouvées.
  • Recherche de citations d'un site en texte brut
    Cet outil vous permet de trouver des pages citant votre site mais ne faisant pas (encore) de lien. Il suffira parfois d'un simple mail pour transformer cette simple citation en lien (backlink).


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité