Google passe outre mon fichier robots.txt , pages ré-indexées
11 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- longo600
- WRInaute impliqué

- Messages: 896
- Inscription: 24 Fév 2005
Google passe outre mon fichier robots.txt , pages ré-indexées
Bonjour,
mon site étant en chantier, j'ai bloqué les robots sur 99% du contenu, avec des doubles fichiers robots.txt.
d"une part à la racine du site, ensuite dans les répertoires a désindexer. j'ai aussi utilisé la suppression directe avec l'outil webmaster, j'ai mis des noindex dans les méta, rechargé mon fichier sitemap.xml épuré... La totale, pour ne conserver que les 3000 pages les plus importantes sur 100 000.
Les premiers mois, la desindexation s'est bien faite, 80 000, 50 000,30 000, 15 000 puis 8 000 ... puis au bout de 3 moins, petit a petit, le nombre a remonté ... et ne cesse depuis. Il m'affiche désormais "Environ 33 300 résultats (0,08 secondes) " sur la reque site:www.monsite.com , et quand j'arrives a la 58eme page qui liste mes urls, il me dis afficher les "580" résultats les plus pertinent.
Ce qui me chiffonne, c'est la première réponse, les 33 300 et pourquoi cela remonte-t-il?
Comme si il n'avais pas totalement effacé les anciennes pages ... ou un vieux data qui a repris des données anciennes?
ce n'est pas ponctuel, depuis le 15 juin, ca ne cesse de remonter chaque jour ....
Quelqu'un a un avis éclairé? que dois-je en déduire?
mon site étant en chantier, j'ai bloqué les robots sur 99% du contenu, avec des doubles fichiers robots.txt.
d"une part à la racine du site, ensuite dans les répertoires a désindexer. j'ai aussi utilisé la suppression directe avec l'outil webmaster, j'ai mis des noindex dans les méta, rechargé mon fichier sitemap.xml épuré... La totale, pour ne conserver que les 3000 pages les plus importantes sur 100 000.
Les premiers mois, la desindexation s'est bien faite, 80 000, 50 000,30 000, 15 000 puis 8 000 ... puis au bout de 3 moins, petit a petit, le nombre a remonté ... et ne cesse depuis. Il m'affiche désormais "Environ 33 300 résultats (0,08 secondes) " sur la reque site:www.monsite.com , et quand j'arrives a la 58eme page qui liste mes urls, il me dis afficher les "580" résultats les plus pertinent.
Ce qui me chiffonne, c'est la première réponse, les 33 300 et pourquoi cela remonte-t-il?
Comme si il n'avais pas totalement effacé les anciennes pages ... ou un vieux data qui a repris des données anciennes?
ce n'est pas ponctuel, depuis le 15 juin, ca ne cesse de remonter chaque jour ....
Quelqu'un a un avis éclairé? que dois-je en déduire?
-

Leonick - WRInaute accro

- Messages: 19592
- Inscription: 8 Aoû 2004
Re: Google passe outre mon fichier robots.txt , pages ré-indexées
il ne peut y avoir qu'un seul robots.txt : à la racinelongo600 a écrit:mon site étant en chantier, j'ai bloqué les robots sur 99% du contenu, avec des doubles fichiers robots.txt.
d"une part à la racine du site, ensuite dans les répertoires a désindexer.
-

f_trt - WRInaute impliqué

- Messages: 927
- Inscription: 17 Sep 2005
Re: Google passe outre mon fichier robots.txt , pages ré-indexées
- longo600
- WRInaute impliqué

- Messages: 896
- Inscription: 24 Fév 2005
Re: Google passe outre mon fichier robots.txt , pages ré-indexées
f_trt a écrit:Que peux tu analyser avec les webmaster tools de google ?
il me donnes simplement Restricted by robots.txt ‎(39,997)‎ ...
Quelques part, il n'efface pas tout semble-t-il. Cela dis, seules les pages qui ne sont pas interdites par le fichier robots.txt reçoivent de la visite. Il n'y a rien de vital dans ma question et préoccupation, c'est juste une curiosité.
Certains produisent tous les efforts pour être indexés, moi c'est pour me dé-indexer , et c'est aussi dur !
En ait, je vais éclater en sous domaines, et je suis prudent du gros changement. D'ou la restriction. Ensuite, je mettrais des redirections 301 à la place des noindex.
-

WebRankInfo - Administrateur du site

- Messages: 19415
- Inscription: 19 Avr 2002
Re: Google passe outre mon fichier robots.txt , pages ré-indexées
Si tu mets un disallow dans le robots.txt, le robot ne peut plus venir voir tes pages pour constater que tu as ajouté une meta robots noindex. Conclusion : il n'a aucune raison de désindexer tes pages. En effet, il obéit à ta 1ère demande qui est de ne plus venir te voir...
Essaie de supprimer les interdictions dans le robots.txt et vérifie que tu as bien mis les balises meta robots noindex sur les pages concernées.
Regarde aussi combien de pages distinctes de ton site te génèrent des visites via le SEO (c'est un indicateur intéressant d'ailleurs).
Essaie de supprimer les interdictions dans le robots.txt et vérifie que tu as bien mis les balises meta robots noindex sur les pages concernées.
Regarde aussi combien de pages distinctes de ton site te génèrent des visites via le SEO (c'est un indicateur intéressant d'ailleurs).
-

M&B Multimédia - WRInaute impliqué

- Messages: 553
- Inscription: 1 Oct 2009
Re: Google passe outre mon fichier robots.txt , pages ré-indexées
Si le site est en chantier, il est préférable :
- de travailler en local
- (ou) de protéger le dossier par htaccess
Sinon +1 pour Leonick et Olivier...
- de travailler en local
- (ou) de protéger le dossier par htaccess
Sinon +1 pour Leonick et Olivier...
-

alexandreb - Nouveau WRInaute

- Messages: 24
- Inscription: 26 Avr 2011
Re: Google passe outre mon fichier robots.txt , pages ré-indexées
M&B Multimédia a écrit:protéger le dossier par htaccess.
C'est la methode imparable pour bloquer les robots, cependant tu
bloqueras aussi les visiteurs mais bon si ton site est en reconstruction...
-

JanoLapin - WRInaute accro

- Messages: 4054
- Inscription: 21 Sep 2008
Re: Google passe outre mon fichier robots.txt , pages ré-indexées
je ne suis pas sur de comprendre. Tu peux préciser, STP, Olivier ?WebRankInfo a écrit:Regarde aussi combien de pages distinctes de ton site te génèrent des visites via le SEO (c'est un indicateur intéressant d'ailleurs).
-

Leonick - WRInaute accro

- Messages: 19592
- Inscription: 8 Aoû 2004
Re: Google passe outre mon fichier robots.txt , pages ré-indexées
comme le but, à terme, est de rediriger ces pages en 301, si, actuellement ces pages n'amènent aucun visiteur, ça n'est pas génant de continuer à les avoir dans l'index de gg. Ca sera plus facile de les rediriger rapidement ensuite. Car si on les désindexe, le retour dans les serp se fera plus lentement.JanoLapin a écrit:je ne suis pas sur de comprendre. Tu peux préciser, STP, Olivier ?WebRankInfo a écrit:Regarde aussi combien de pages distinctes de ton site te génèrent des visites via le SEO (c'est un indicateur intéressant d'ailleurs).
- longo600
- WRInaute impliqué

- Messages: 896
- Inscription: 24 Fév 2005
Re: Google passe outre mon fichier robots.txt , pages ré-indexées
Il est clair qu'en théorie, le premier fichier robots.txt doit suffire à lui seul, le reste n'est donc que superflus.
Pour la stratégie de restructuration, ces désindexations de pages n'étaient pas nécessaires. Je l'ai fait car ces pages (rubrique sur 1 département) étaient très pauvres, voire sans fiche et ne comportaient qu'un lien vers le total des fiche sur toute la france.
Rien de bon pour l'internaute que de tomber sur une fiche vide ...
Surtout que Google s'est entété a indexer surtout les pages vide et les classer en premier dans les serp ! incroyable mais j'ai du me battre (...) pour qu'il cesse de mettre en premier ces pages vide. J'ai essayé par de nombreux moyens (liens, sitemap, fichier sitemap, liens en première page etc ...et MEME LE CANONICAL). Rien n'a fait.
Mes pages "riches", sur la même rubriques n'apparaissaient jamais. Malgré un lien venant de celle pauvre du département pointant sue la page riche france entière, et pas l'inverse...
J'ai dailleur une "théorie" sur ce point. En fonction de la "notoriété" ou note que Google attribue à un site, il cherche à le classer en fonction de la concurrence sur les requêtes ou les rubriques. Si le site est "de grande notoriété" , il classera ses pages sur des requetes concurrentielles en fonction des paramètres normal de l'algorithme , c'est a dire poids et richesse d'une page.
Si le site a une "mauvaise note", il classera plutôt des pages "sur la longue traine" ou sur des requêtes rares, quitte à ce que cette page soit très pauvre (vraiment pauvre ...).
BEN VOILA, il suffit que j'écrive pour que , en contrôlant, TOUT VIENS DE CHANGER ...
Le classement de mes pages sur site:www.monsite.com viens d'être totalement chamboulé entre vendredi (et depuis des mois) et aujourd'hui. J'apparait désormais sur quelques requêtes ou domaines concurrentiels (ex meuble ancien en france = 1ere page vers le bas). A cette heure ou j'écris, mon trafic quotidien ne semble pas avoir augmenté toutefois.
Bref, sur la théorie, c'est perfectible ... Mais comme je n'arrivais à virer les pages vides et mettre (par tous les moyens possibles) mes pages riches en avant, j'ai mis un fichier robots.txt n'autorisant que le chemin vers les pages riches.
Et comme tout va changer, sauf ca, ce n'est pas un mal.
Donc, j'ai tout viré de l'index, ne gardant que les 3000 pages des rubriques bien remplies sur la France entière.
Je m'interroge qu'après 4 mois, il y a encore 33 000 pages indexé selon google...
Pour la stratégie de restructuration, ces désindexations de pages n'étaient pas nécessaires. Je l'ai fait car ces pages (rubrique sur 1 département) étaient très pauvres, voire sans fiche et ne comportaient qu'un lien vers le total des fiche sur toute la france.
Rien de bon pour l'internaute que de tomber sur une fiche vide ...
Surtout que Google s'est entété a indexer surtout les pages vide et les classer en premier dans les serp ! incroyable mais j'ai du me battre (...) pour qu'il cesse de mettre en premier ces pages vide. J'ai essayé par de nombreux moyens (liens, sitemap, fichier sitemap, liens en première page etc ...et MEME LE CANONICAL). Rien n'a fait.
Mes pages "riches", sur la même rubriques n'apparaissaient jamais. Malgré un lien venant de celle pauvre du département pointant sue la page riche france entière, et pas l'inverse...
J'ai dailleur une "théorie" sur ce point. En fonction de la "notoriété" ou note que Google attribue à un site, il cherche à le classer en fonction de la concurrence sur les requêtes ou les rubriques. Si le site est "de grande notoriété" , il classera ses pages sur des requetes concurrentielles en fonction des paramètres normal de l'algorithme , c'est a dire poids et richesse d'une page.
Si le site a une "mauvaise note", il classera plutôt des pages "sur la longue traine" ou sur des requêtes rares, quitte à ce que cette page soit très pauvre (vraiment pauvre ...).
BEN VOILA, il suffit que j'écrive pour que , en contrôlant, TOUT VIENS DE CHANGER ...
Le classement de mes pages sur site:www.monsite.com viens d'être totalement chamboulé entre vendredi (et depuis des mois) et aujourd'hui. J'apparait désormais sur quelques requêtes ou domaines concurrentiels (ex meuble ancien en france = 1ere page vers le bas). A cette heure ou j'écris, mon trafic quotidien ne semble pas avoir augmenté toutefois.
Bref, sur la théorie, c'est perfectible ... Mais comme je n'arrivais à virer les pages vides et mettre (par tous les moyens possibles) mes pages riches en avant, j'ai mis un fichier robots.txt n'autorisant que le chemin vers les pages riches.
Et comme tout va changer, sauf ca, ce n'est pas un mal.
Donc, j'ai tout viré de l'index, ne gardant que les 3000 pages des rubriques bien remplies sur la France entière.
Je m'interroge qu'après 4 mois, il y a encore 33 000 pages indexé selon google...
11 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- mis à jours du fichier robots et google
- Index google et fichier robots.txt ?
- probleme avec fichier robots.txt fichier bloquer
- Fichier robots.txt VS balise meta robots
- Non respect du fichier robots.txt par Google
- Google Adsense Bot et fichier Robots.txt
- Google ne reconnait pas mon fichier robots.txt
- Limites du fichier robots.txt 100 lignes pour GOOGLE
- Ajout d'un fichier robots.txt après référencement par Google
- Mise à jour du fichier robots.txt : dire à Google qu'il doit modifier le contenu indexé
Consultez la description détaillée des produits ou services de Google suivants : Google Sitemaps
- Synthèse du référencement Google
Cet outil vous donne un petit résumé de l'état de référencement de votre site dans Google.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
