URL avec noindex, bloquée par le robots.txt mais dans l'index google !
16 messages
• Page 1 sur 2 • 1, 2
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

jojohit - WRInaute discret

- Messages: 59
- Inscription: 12 Mai 2008
URL avec noindex, bloquée par le robots.txt mais dans l'index google !
Bonsoir,
Pour que les pages de faible qualité de mon site ne soit pas indexées par Google ; j'ai mis en place la balise <meta name="robots" content="noindex, follow"> et j'ai bloqué l'url dans le fichier robots.txt. L'url est bien bloquée par ce fichier lorsque j'effectue un test dans le GWT.
Pourtant, en faisant une recherche dans Google avec inurl, l'url apparait bien.
Aurai-je loupé quelque chose ? Car là, je ne comprends vraiment pas pourquoi cette url est indexée.
Pour que les pages de faible qualité de mon site ne soit pas indexées par Google ; j'ai mis en place la balise <meta name="robots" content="noindex, follow"> et j'ai bloqué l'url dans le fichier robots.txt. L'url est bien bloquée par ce fichier lorsque j'effectue un test dans le GWT.
Pourtant, en faisant une recherche dans Google avec inurl, l'url apparait bien.
Aurai-je loupé quelque chose ? Car là, je ne comprends vraiment pas pourquoi cette url est indexée.
-

UsagiYojimbo - WRInaute accro

- Messages: 8583
- Inscription: 23 Nov 2005
Re: URL avec noindex, bloquée par le robots.txt mais dans l'index google !
Tu as mis tout ça en place APRES ou AVANT que la page soit indexée ?
-

UsagiYojimbo - WRInaute accro

- Messages: 8583
- Inscription: 23 Nov 2005
Re: URL avec noindex, bloquée par le robots.txt mais dans l'index google !
Tu as d'autres url dans ce cas, ou uniquement celle-là ? Pour une url, tu peux en demander la suppression via GWT
-

jojohit - WRInaute discret

- Messages: 59
- Inscription: 12 Mai 2008
Re: URL avec noindex, bloquée par le robots.txt mais dans l'index google !
Oui, plusieurs dizaines... Et comme je n'ai pas envie de toutes les taper dans l'outil de suppression d'URL du GWT, quelle est maintenant la meilleure solution ?
Est-ce que le fait de bloquer l'url dans le robots.txt l'empêche de lire la balise meta noindex ?
Une page indexée avec la balise meta noindex sera-t-elle automatiquement désindexée dans le temps par Google ?
Est-ce que le fait de bloquer l'url dans le robots.txt l'empêche de lire la balise meta noindex ?
Une page indexée avec la balise meta noindex sera-t-elle automatiquement désindexée dans le temps par Google ?
-

Tigerfou - WRInaute discret

- Messages: 187
- Inscription: 16 Juin 2011
Re: URL avec noindex, bloquée par le robots.txt mais dans l'index google !
Bonjour,
Si ta page est interdite au crawl par robots.txt comment veux-tu que google voie ton meta robot noindex ?
Il faut l'enlever du robots.txt.
Problème déjà abordé ici : http://forum.webrankinfo.com/page-recherche-php-indexee-malgre-noindex-t148390.html
Si ta page est interdite au crawl par robots.txt comment veux-tu que google voie ton meta robot noindex ?
Il faut l'enlever du robots.txt.
Problème déjà abordé ici : http://forum.webrankinfo.com/page-recherche-php-indexee-malgre-noindex-t148390.html
-

jojohit - WRInaute discret

- Messages: 59
- Inscription: 12 Mai 2008
Re: URL avec noindex, bloquée par le robots.txt mais dans l'index google !
Au départ, je n'avais que la meta no index en place et je m'amusais à supprimer plusieurs dizaines d'url via le GWT.
En fait c'est la même forme d'url avec simplement une variable qui change.
J'avais modifié ce week-end mon robots.txt pour bloquer cette forme d'url, ayant au préalable supprimé manuellement via le GWT toutes les urls indexées.
Comme par hasard, après de nouvelles publications sur mon site et la modification du robots.txt, les urls associées à ces nouvelles publications se retrouvent indexées.
je viens de remettre mon robots.txt comme à l'origine pour ne pas générer de conflit avec la meta noindex.
En fait c'est la même forme d'url avec simplement une variable qui change.
J'avais modifié ce week-end mon robots.txt pour bloquer cette forme d'url, ayant au préalable supprimé manuellement via le GWT toutes les urls indexées.
Comme par hasard, après de nouvelles publications sur mon site et la modification du robots.txt, les urls associées à ces nouvelles publications se retrouvent indexées.
je viens de remettre mon robots.txt comme à l'origine pour ne pas générer de conflit avec la meta noindex.
-

UsagiYojimbo - WRInaute accro

- Messages: 8583
- Inscription: 23 Nov 2005
Re: URL avec noindex, bloquée par le robots.txt mais dans l'index google !
Si c'est juste une histoire de paramètres, tu peux aussi voir à gérer ça finement via GWT.
-

jojohit - WRInaute discret

- Messages: 59
- Inscription: 12 Mai 2008
Re: URL avec noindex, bloquée par le robots.txt mais dans l'index google !
Sauf que la majorité mes urls avec variable sont réécrites. Du coup, Google ne semble pas les reconnaitre.
Il me propose simplement comme paramètres les variables et bien distinctes dans les url non réécrites.
Il me propose simplement comme paramètres les variables et bien distinctes dans les url non réécrites.
-

Leonick - WRInaute accro

- Messages: 19599
- Inscription: 8 Aoû 2004
Re: URL avec noindex, bloquée par le robots.txt mais dans l'index google !
il semblerait que gg se soit rapproché du fonctionnement de feu yahoo : le contenu des url non indexables n'est pas inclus dans l'index, mais les url si, elles apparaissent avec rien en dessous
-

Tigerfou - WRInaute discret

- Messages: 187
- Inscription: 16 Juin 2011
Re: URL avec noindex, bloquée par le robots.txt mais dans l'index google !
Leonick a écrit:le contenu des url non indexables n'est pas inclus dans l'index, mais les url si, elles apparaissent avec rien en dessous
Tu veux dire le contenu des url non crawlables.
Petit résumé :
- Utilisation du meta robots noindex SEUL (sans robots.txt) => Google crawl le fichier, voit le noindex et n'affiche pas cette page dans ses résultats de recherche, le fichier n'est pas indexé.
- Utilisation du fichier robots.txt SEUL (sans le meta noindex) => Google ne peut pas crawler le fichier, donc le lire. En revanche rien ne l'empêche de l'indexer, donc s'il arrive à ce fichier par un lien quelconque, il le met dans son index. Puisqu'il ne peut pas lire le contenu du fichier, il n'affichera rien dessous sur ses SERP (pas de title, pas de description, rien).
- Utilisation du fichier robots.txt AVEC meta noindex => il se passe la même chose qu'avec le fichier robots.txt seul, puisque le meta noindex est invisible au robot. Fichier indexé, mais qui n'affiche ni title ni description dans les résultats de google.
Voilà j'espère que ça peut aider
Johann
-

Leonick - WRInaute accro

- Messages: 19599
- Inscription: 8 Aoû 2004
Re: URL avec noindex, bloquée par le robots.txt mais dans l'index google !
oui, quoique, j'ai des doutesTigerfou a écrit:Tu veux dire le contenu des url non crawlables.![]()
ça dépend, des fois il peut afficher l'ancre trouvé sur un lien vers cette pageTigerfou a écrit:Puisqu'il ne peut pas lire le contenu du fichier, il n'affichera rien dessous sur ses SERP (pas de title, pas de description, rien).
-

Tigerfou - WRInaute discret

- Messages: 187
- Inscription: 16 Juin 2011
Re: URL avec noindex, bloquée par le robots.txt mais dans l'index google !
Leonick a écrit:ça dépend, des fois il peut afficher l'ancre trouvé sur un lien vers cette page
Exact, j'ai pas vu d'exemple, mais c'est certainement possible. Tu en as observé ?
16 messages
• Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- AdSense : robots.txt url bloquée
- URL bloquée : Fichier Robots.txt
- Refus de GWT de supprimer url bloquée dans robots.txt
- robots txt ou noindex ?
- Url bloquée - Diagnostic du site
- URGENT : <meta name="robots" content="noindex,follow" /> et Google m'indexe mes pages !
- URL bloquée dans le diagnostic Adsense
- URL bloquée qui ne m'appartient pas
- url bloquée mais les pubs s'affichent !?
- Vous n'avez actuellement aucune URL bloquée -> tranquile
- Analyse des backlinks
Cet outil vous permet d'analyser en détails la "popularité" de votre site sur Google. En plus du nombre de liens pris en compte par Google, il calcule le pourcentage de liens internes parmi tous les liens, et il affiche les premières URL trouvées.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
