Pages en noindex indexées

Nouveau WRInaute
Bonjour,
Dans le cadre d'une meilleure gestion des duplications de contenu, les fiches produits d'un site e-commerce dont les URL varient en fonction de la navigation ont été placées en noindex. (on ne conserve que l'URL de la navigation principale)
Jusqu'à présent je pensais que c'était respecté mais je viens de m'apercevoir qu'en fait cela n'était pas le cas.
Je pensais que cela ne concernait que d'anciennes URL que google n'aurait pas encore crawlé, mais je m'aperçois que même les nouvelles fiches produits sont indexées.
Google peut-il décider d'indexer des pages malgré l'interdiction ?

De plus, on avait pris des précautions (qui normalement sont inutiles) en spécifiant une canonical vers la bonne URL produit.
Donc le noindex il le zappe, et la canonical il s'en tamponne.
Mieux encore, sur les requêtes produits, c'est bien ces fiches noindex qui ressortent...

C'est légèrement rageant de faire en sorte de rendre une copie propre et de savoir que les fiches produits sont dupliquées.

Ne vaut-il pas mieux ouvrir dans tous les sens, indexer 3 fois plus de pages et laisser Google faire le ménage tout en s'exposant à une MAJ d'algo qui viendra pénaliser ces duplications.
 
WRInaute passionné
Attention à ne pas avoir empêché le crawl de ces pages avec le robots.txt
Car dans ce cas, il n'y va pas et ne verra pas le noindex !
détail : -http://blog.axe-net.fr/noindex-nofollow-robots-txt-attention-erreurs/
 
Nouveau WRInaute
Non bien entendu ces pages ne sont pas bloquées (et puis je pense que ca se verrait au niveau de la méta description)

Je voulais juste savoir si certains d'entre vous avez déjà rencontré ce genre de cas et surtout quelle logique avoir face à cela
 
WRInaute accro
es-tu certain que plus loin dans le body il n'y a pas une balise meta robots index ?
Tu peux aussi installer le plugin SEO Doctor qui va te dire si la page est indexable ou non
 
Nouveau WRInaute
Non pas d'autres balises dans le code.

Je pensais que l'on n'avait pas forcément le droit de citer de sites dans cette partie.
Prenez l'exemple de cette page : http://www.fxmotors.fr/fr/accueil/marques/thor-mx/maillot-thor-mx-prim ... ellow-2016
<meta name="robots" content="noindex, follow" />
<link rel="canonical" href="http://www.fxmotors.fr/fr/accueil/equipements-motocross/v-tements-cross/maillots-cross/maillot-thor-mx-prime-fit-squad-blue-yellow-2016" />

Si dans Google vous recherchez : "Maillot Thor Prime Fit Squad" vous trouverez en 4ème position le site Fx Motors avec la page marque qui contient le noindex. L'un des résultats images est le pantalon de la même gamme provenant d'une page noindex aussi, alors que le résultat shopping est bien celui de la page "rubrique" (celle vers laquelle pointe la canonical) que l'on soumet via le flux.

Cette fiche produit a été mise en ligne début aout (avec sa balise noindex) et recrawlée le 4 septembre.

Que faut-il en conclure ?
 
WRInaute accro
Comme tu le dis dans ton message, la page a été crawlée le 4 septembre. C'est bien ce qui est indiqué dans la version en cache de Google. Cette page en cache contient la ligne suivante:
Code:
<meta name="robots" content="index, follow,all" />
Bizarre, non ?

Jean-Luc
 
Nouveau WRInaute
Bien vu Jean Luc !
J'en perds mon latin :-/
En tout cas, ça explique déjà l'indexation de ces pages.

Comment Google pourrait-il voir des consignes autres ?
Il faut que l'on voit au niveau de la construction du code HTML des pages comment cela se passe.

On note une légère progression du trafic sur les pages issues du "silo" marque. Google nous fait il passer un message sur la pertinence de ces pages ?

Ma crainte est que désormais, si on corrige ce no-index, les 200 pages réactives ne le soient plus et que Google ne choisissent pas l'autre version de la page produit ou ne lui accorde pas la même pertinence.
Ou alors j'oublie totalement cette histoire de noindex sur les autres versions de la fiche produit en optant uniquement pour la canonical, ou en laissant "naturellement" Google faire son choix entre les différentes versions.
 
WRInaute passionné
Salut, <meta name="robots" content="index, follow,all" /> est l'équivalent de ne pas mettre cette ligne.

Je pense que sans doute le 4 septembre c'est ce qu'il y avait quand Google est passé sur l'autre page. A voir si ca fait encore pareil à partir d'aujourd'hui.

Sinon pour ta dernière réflexion, c'est ce que je fais depuis toujours, je le laisse se débrouiller, chacun son job. Surtout que toutes les déclarations de Google au sujet du duplicate content c'est de ne pas s'en occuper, interne et externe. Il n'y a que sur les forums SEO que c'est super grave le duplicate content :)
 
Nouveau WRInaute
Comment puis-je supprimer canonique parce que je l'ai cherché dans Google et ce ne pas trouver quelque chose.

Merci
 
Discussions similaires
Haut