Canonical + noindex : contradictoire ?

supercanard · 24 Novembre 2010

Bonjour,

J'ai été contraint d'avoir 2 URL pour une même page. Sachant que ça risque de poser un problème de duplicate content j'ai donc utilisé la balise canonical pour l'URL secondaire. Mais je me suis dit, après tout puisque je veut que Google ne tienne compte que de l'URL de base autant lui dire de pas indexer les pages doublon...

J'ai donc mon URL de base
http://site.com/page.html

Et mon URL secondaire renvoyant sur la même page :
http://site.com/categorie/page.html

Pour le second cas j'ai donc ma canonical et mon noindex dans la page :

Code:

<link rel="canonical" href="http://site.com/page.html" />
<meta name="robots" content="noindex">
<meta name="googlebot" content="noindex">

Mais maintenant je me pose une question :
Le fait que Google rencontre le noindex devrait en théorie faire qu'il n'indexe pas cette page... y'a t-il un risque que du coup il ne tienne pas compte également de l'URL de base qu'il trouve dans la balise canonical ? ... et que dans ce cas il n'indexe rien du tout ?

Merci de votre aide

bproductiv · 24 Novembre 2010

Moi je mettrai noindex sur le 2 et canonical sur la 1, non ?

Emorej · 24 Novembre 2010

Je recopie ci-dessous une réponse que j'avais faite sur le forum google pour un cas voisin (donc duplicate content

).
Dans ton cas il vaudrait mieux quand même veiller à ce que la page canonique soit accessible par d'autres liens que la seule page dupliquée.

C'est une question qui m'a également occupé pendant un moment... Je te conseille cette discussion sur le forum google.com : https://www.google.com/support/forum/p/Webmasters/thread?tid=79b4544fb7e1cb3c&hl=en

JohnMu de Google y apporte des réponses. Ce que j'en retire, c'est qu'il faut d'abord savoir que rien ne s'oppose à l'utilisation commune de noindex et canonical. La seule objection de JohnMu consiste à dire que si une page en noindex est trouvée avant que la page originale/canonique ne le soit, rien ne sera indexé dans google à cause de ce noindex. Il faudra patienter jusqu'à ce que la page canonique soit crawlée.
Une seconde précision d'importance est que un noindex sur une page 'dupliquée' n'entrainera pas un noindex automatique sur la page canonique (ça parait évident, mais pour une fois qu'on peut avoir une certitude sur l'algo, autant la noter !!).

Pour ma part, j'estime que la page canonique est en général plus facilement accessible que les pages dupliquées, donc le laps de temps éventuel pendant lequel elle serait non indexée doit être très faible.
Je place un 'noindex,follow' + canonical sur les pages dupliquées pour ne pas perdre de jus (follow). Je préfère mettre cela et éviter à coup sûr le duplicate content... On verra lorsqu'on sera certain que la balise canonical n'est pas qu'une simple 'suggestion' comme elle est manifestement présentée.

jerome

cedric_g · 25 Novembre 2010

Bonjour

Aucun problème pour ma part, depuis que Canonical est sorti, je l'utilise sur nombre de sites (et notamment des boutiques en ligne) ; seule la page avec l'URL "propre" (dans mon cas sans paramètres de tri ou d'affichage des produits par exemple) est en "index,follow", toutes les variantes sont en "noindex,follow", mais toutes sans exception ont la balise Canonical pointant vers la page "valide" (celle qui est en "index,follow")

supercanard · 25 Novembre 2010

Merci pour vos réponses

Je comprends donc que ça ne pose pas de problèmes, tant que la page valide est facilement crawlable par google (ce qui est évidement le cas) ?