Refus de GWT de supprimer url bloquée dans robots.txt

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

pamplona
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 11
Inscription: 15 Nov 2007

Refus de GWT de supprimer url bloquée dans robots.txt

Message le Dim Mar 16, 2008 15:08

Bonjour,

j'ai découvert avec stupeur que depuis moins d'un mois, Google a réindexé des dizaines de milliers d'url d'un même répertoire que j'ai pourtant bloqué avec le robots.txt
(Sans rentrer dans les détails, il est trop compliqué d'ajouter à ces pages des meta noindex, c'est pourquoi je suis passé par le fichier robots...)

Je pense que ceci est certainement dû à des BL malheureux, mais impossible d'en trouver la source (GWT ne me donne plus aucun liens internes ou externes dans la console alors que j'en avais des milliers il y a encore une semaine, et yahoo site explorer ne connait pas ces url, il a su les ignorer lui...)

Bref, passons sur le pourquoi de l'indexation, je cherche désormais à réparer le mal fait.
Ce phénomène étant arrivé il y a 6 mois, j'avais alors utilisé l'option "url à supprimer" de Google Webmaster Tools; tout s'était bien déroulé, en quelques jours, l'index a été nettoyé.

Maintenant qu'elles sont revenues, je veux faire la même manip' et là GWT me répond "Refusé" avec pour détails un lien vers le centre d'aide GWT, chapitre robots.txt

Je ne comprends rien à rien, j'ai scrupuleusement suivi la même procédure qu'il y a 6 mois:
1/ blocage du répertoire dans robots.txt (le robots.txt est le même qu'il y a 6 mois)
2/ demande de suppression url

Ce qui est fou c'est que googlebot a chargé mon robots.txt aujourd'hui, renvoie bien un code d'état 200, quand je teste une url dans GWT, il me répond "url bloquée".

or quand j'utilise la commande site:www.example.com/repertoire-a-bloquer avec l'option date "depuis 24h", il me renvoie 280 nouvelles url. "depuis 31 jours", il m'en renvoie + 50000....

:arrow: Googlebot se fout donc à la fois de mon robots.txt et de ma demande de suppression!

plusieurs choses m'inquiètent donc:
- ces nouvelles url indexées qui ne font que polluer l'index, ah et j'ai oublié de dire, elles sont toutes en duplicates, elles ne diffèrent que par un sid... j'en ai + de 50 000 aujourd'hui donc...
- impossible de les virer de l'index
- je n'ai plus aucune donnée dans la rubrique Liens de GWT : liens externes ou internes, et "ce que voit googlebot"
- mais mes mots clés principaux n'ont pas bougé dans les SERP. Je pense avoir perdu sur la longue traine mais c'est extrêmement dur de le vérifier, j'ai + de 80000 requêtes différentes qui mènent à mon site
- mes pages indexées sont stables sur tous les datas avec la commande site: (sauf si je la précise avec mon répertoire dans l'url)
- et surtout surtout mon audience en provenance de GG a perdu 30% depuis 2 jours (d'où toutes ces analyses)

J'ai pu lire que la commande site: fait le yoyo depuis une semaine, c'est donc aussi le cas pour moi, mais le + inquiétant c'est que depuis 1 mois au moins, googlebot semble faire n'importe quoi et celà commence à me pénaliser sans que je puisse réparer le mal fait.

Qu'en pensez-vous? Avez-vous observé ce même phénomène sur des url bloquées par le robots.txt?
Que puis-je faire à part re-demander des suppressions d'url? (nb je ne peux faire du rewriting pour ces url car le sid qu'elles contiennent est important, et quand bien même je souhaite de toute façon qu'elles virent de l'index)


Serious
WRInaute passionné
WRInaute passionné
 
Messages: 2438
Inscription: 21 Nov 2005

Message le Dim Mar 16, 2008 20:27

Montre nous ton robots.txt.
Sinon tu peux toujours "cloaker" pour interdire l'acces a GBot.

pamplona
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 11
Inscription: 15 Nov 2007

Message le Lun Mar 17, 2008 0:19

voila exactement la ligne interdisant le répertoire, ligne qui n'a pas été modifiée depuis 6 mois...
Code: Tout sélectionner
User-agent: *
Disallow: /includes/

Et y'a 6 mois, google était ok pour me supprimer toutes les url du répertoire includes...


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités