Difficulté à empêcher les moteurs de référencer une section

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

TigrouMeow
Nouveau WRInaute
 
Messages: 8
Inscription: Jeu Oct 20, 2005 10:38

Difficulté à empêcher les moteurs de référencer une section

Message le Mer Juin 14, 2006 10:46

Bonjour,

J'essaye en vain d'empêcher Google de passer sur une certaine partie de mon site. Mon site est www.meow.fr et contient une section ou il y a des caractères chinois. En fait elle est seulement inaccessible via un clic sur le caractère chinois (à gauche en dessous du menu) ou par utilisation d'un formulaire. Il y a un grand nombre de caractères sur le site, et vu que le contenu n'a aucun intérêt et désavantage les autres pages, je veux que cette partie ne soit pas référencée.

La manière simple d'empécher le référencement de ces pages a été de rajouter dans le header la meta qui indique le non référencement.

<meta name="robots" content="noindex, nofollow" />


Mais avec ça, je vois que GoogleBot va encore charger ces pages.

L'autre moyen est le "robots.txt". Exclure par le répertoire, j'ai essayé mais ça me pose trop de problèmes, tous mes liens, les images, mes références deviennent fausses... Et exclure par fichier, le problème c'est que mon site entier utilise seulement un seul fichier qui est l'index.php. J'ai tenté l'url rewriting de cette manière :

RewriteRule ^chinese\.php\!id=([0-9]{1,5})&answer=(.*)$ index.php?rubrik=chinese&answer=$2&id=$1 [L]


Cela aurait permit d'avoir un semblant de fichier chinese.php (qui n'existe en fait pas), et qui aurait transformer une requête "virtuelle" en une vrai. Pas de chance, l'url rewriting à priori, quand il voit un "?" considère que ce qui est derrière doit être gardé, et il ne s'occupe que ce qui est devant, en fait du nom du fichier... Je savais pas ça, et j'ai pas trouvé de technique pour contourner ce problème.

La seule technique que j'ai trouvé, c'est de faire une copie pure et simple de mon index.php en ask.php, et de refaire les liens de ma section chinoise vers ask.php, et d'exclure ce fichier dans le robots.txt. Cela reste malpropre d'utiliser un fichier doublon, bref ça me dérange un peu :)

Que pensez-vous de cette solution ? Est-ce la meilleure ? Voyez-vous une solution avec l'url rewriting, comme je voulais faire ? (peut-être je ne sais pas tout... et sûrement pas d'ailleurs !)

Merci :wink:


david96
WRInaute accro
WRInaute accro
 
Messages: 1410
Inscription: Dim Aoû 28, 2005 21:56

Message le Mer Juin 14, 2006 11:22

Sinon tout simplement :
Supprimez votre URL de Google ;-)

TigrouMeow
Nouveau WRInaute
 
Messages: 8
Inscription: Jeu Oct 20, 2005 10:38

Message le Mer Juin 14, 2006 13:05

Hein ? Mais c 'est pas le but, justement je me bat pour un meilleur référencement, alors si je supprime mon site... :(

HecateOR
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 162
Inscription: Jeu Avr 20, 2006 14:52

Message le Mer Juin 14, 2006 13:57

Pas tout ton site, juste les url des pages que tu ne veux pas qu'il indexe... :roll:


david96
WRInaute accro
WRInaute accro
 
Messages: 1410
Inscription: Dim Aoû 28, 2005 21:56

Message le Mer Juin 14, 2006 16:13

Bâ oui ! :lol:

TigrouMeow
Nouveau WRInaute
 
Messages: 8
Inscription: Jeu Oct 20, 2005 10:38

Message le Mer Juin 14, 2006 18:10

Le problème c'est que c'est trop tard :) Google n'arrête pas depuis 2 jours d'indexer des pages qui n'ont plus lieu d'être... J'ai l'impression qu'il a une sauvegarde des liens d'avant et qu'il les parcoure tous ! Alors qu'ils ont tous changé...


david96
WRInaute accro
WRInaute accro
 
Messages: 1410
Inscription: Dim Aoû 28, 2005 21:56

Message le Mer Juin 14, 2006 22:23

Mais il n'est jamais trop tard pour supprimer une page de google !
Tiens va voir ce lien, tu vas comprendre :
http://www.google.fr/intl/fr/remove.html ;-)


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2661
Inscription: Lun Mai 03, 2004 14:48

Message le Mer Juin 14, 2006 22:42

Bonsoir,

C'est normal qu'avec la meta "robots" avec "noindex, nofollow", Googlebot continue de visiter ces pages, mais elles disparaîtront de l'index. Il faut bien que Googlebot visite ces pages pour y lire la meta et ainsi savoir que la page ne doit plus apparaître dans les résultats de recherche. Je suppose qu'après quelques passages à un rythme normal, ces passages vont s'espacer, parce que je serais étonné que Googlebot consacre beaucoup de ressources à des pages qu'il ne peut pas exploiter.

Si tes URL concernées sont de la forme /index.php?rubrik=chinese&answer=azerty&id=123, tu peux mettre la ligne suivante dans robots.txt :
Code: Tout sélectionner
Disallow: /index.php?rubrik=chinese

Ceci indique aux robots de ne pas visiter de page dont l'adresse commence par /index.php?rubrik=chinese.

Jean-Luc

TigrouMeow
Nouveau WRInaute
 
Messages: 8
Inscription: Jeu Oct 20, 2005 10:38

Message le Jeu Juin 15, 2006 5:29

Merci bien, à priori Google à arrêter de référencer ces pages ! Par contre, j'ai du faire une erreur et dans mon robots.txt j'ai mis :
Disallow: ask.php

Ne serait-ce pas plutôt ceci :
Disallow: /ask.php

En fait je m'en suis aperçu aujourd'hui, et j'ai vu que Google référençait ces pages maintenants... donc j'espère que ce "/" est important.

Sinon autre question, tous les combien Google va voir le fichiers robots.txt ?


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2661
Inscription: Lun Mai 03, 2004 14:48

Message le Jeu Juin 15, 2006 6:46

Oui, le "/" du début est nécessaire.

Considère que Google lit le robots.txt au moins une fois toutes les 24 heures. Puis, il lui faudra, au pire, quelques jours avant que tous les Googlebots en tiennent compte.

Jean-Luc


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Test de redirection
    Cet outil vous permet de tester la validité d'un lien pour le référencement. Il vous indique la nature du lien (lien en dur, redirection bien gérée par les moteurs ou redirection mal gérée par les moteurs).


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités