Retour d'expérience sur le duplicate content

WRInaute discret
Bonjour, nous sommes responsables de plusieurs sites de VPC B2B, avec les mêmes produits, mais devons offrir des sites aux URLs différentes pour les internautes des différents pays (question de crédibilité, de coordonnées et de coûts différents).
Nous avons donc ces sites en ligne :
-http://www.seton.fr (commande site: 20500 pages)
-http://www.seton.be/fr/ (commande site: 157 pages)
-http://www.seton.be/nl/ (commande site: 201 pages)
-http://www.seton-nl.com (commande site: 624 pages)
-http://www.seton.es (commande site: 1060 pages)
Tous les sites ont pour l'instant la même IP.
Le soucis est que les pages du be/nl, nl et be/fr ont quasiment disparues de GG avec la commande site (et que nos stats s'en ressentent également). La cause à mon avis : Le duplicate content entre le FR/BEfr et le NL/BEnl.
Mais si GG ne conserve qu'une URL, pour quoi le NL et le BE/nl ont chutés tous les deux quasiment au même moment ??? De plus le ES a chuté également, quel en est la raison ???

Nous envisageons donc plusieures modif° pour obtenir des pages différentes :
- Titres, descriptions et keywords différents sur toutes les pages des pays concernés
- Déclarer la langue du site dans la balise HTML (<HTML lang="fr">)
- Héberger chaque site sur des serveurs appartenant aux pays concernés
- Cross-selling différents (choix de 3 produits parmis 10 aléatoires)
- Intégrer des synonymes pour les noms de rub. statiques (ex. Consulter la fiche VS Voir le produit).
- Positionner les balises H1, H2 et H3 de façon différente pour les différents pays
- Organiser une grande campagne de soumissions lorsque les modif° désirées aurons été réalisées.

Le soucis est que nous ne maîtrisons pas les modif° des sites (nous dépendons d'une agence web), nous ne disposons que d'un back-office pour modifier les fiches produits. J'ai donc ajouter "manuellement" du cross-selling sur deux fiches produit : FR et BEfr.
J'ai également mis en ligne des pages ne contenant que du texte, avec différentes options.
Voilà les résultats :
Pages originales sans cross-selling, avec titre, description et nom de page identique (plus en ligne) :
Page (Dice/Jacard) : 99,92/99,84
Titre (Dice/Jacard) : 100/100
Desc (Dice/Jacard) : 100/100
URL (Dice/Jacard) : 100/100
Similar Page Checker : 98

Pages originales avec cross-selling et titre, description et nom de page différents :
-http://www.seton.be/fr/poteaux_et_accessoires_sur_socle_leste.asp
-http://www.seton.fr/poteaux_en_acier_sur_socle_leste.asp
Page (Dice/Jacard) : 99,42/98,85
Titre (Dice/Jacard) : 66,67/50
Desc (Dice/Jacard) : 86,36/76
URL (Dice/Jacard) : 50/33,33
Similar Page Checker : 76

Pages dupliquées en texte seul avec cross-selling et titre, description et nom de page différents :
-http://www.drouart.net/seton/befr-poteaux_et_accessoires_sur_socle_leste.htm
-http://www.drouart.net/seton/fr-poteaux_en_acier_sur_socle_leste.htm
Page (Dice/Jacard) : 94,36/89,32
Titre (Dice/Jacard) : 36,36/22,22
Desc (Dice/Jacard) : 86,36/76
URL (Dice/Jacard) : 57,14/40
Similar Page Checker : 83

Pages dupliquées en texte seul avec cross-selling et titre, description et nom de page différents et emploi de synonymes pour les mots du menu (sauf arbo catalogue) :
-http://www.drouart.net/seton/befr-syn-poteaux_et_accessoires_sur_socle_leste.htm
-http://www.drouart.net/seton/fr-syn-poteaux_en_acier_sur_socle_leste.htm
Page (Dice/Jacard) : 91,36/84,09
Titre (Dice/Jacard) : 36,36/22,22
Desc (Dice/Jacard) : 86,36/76
URL (Dice/Jacard) : 57,14/40
Similar Page Checker : 80

Pages dupliquées en texte seul avec cross-selling et titre, description et nom de page différents et emploi de synonymes pour les mots du menu (sauf arbo catalogue) + 450 caractères différents :
-http://www.drouart.net/seton/befr-syn-450-poteaux_et_accessoires_sur_socle_leste.htm
-http://www.drouart.net/seton/fr-syn-450-poteaux_en_acier_sur_socle_leste.htm
Page (Dice/Jacard) : 88,27/79,01
Titre (Dice/Jacard) : 36,36/22,22
Desc (Dice/Jacard) : 86,36/76
URL (Dice/Jacard) : 57,14/40
Similar Page Checker : 72

Pages dupliquées en texte seul avec cross-selling et titre, description et nom de page différents et emploi de synonymes pour les mots du menu (sauf arbo catalogue) + 1000 caractères différents :
-http://www.drouart.net/seton/befr-syn-1000-poteaux_et_accessoires_sur_socle_leste.htm
-http://www.drouart.net/seton/fr-syn-1000-poteaux_en_acier_sur_socle_leste.htm
Page (Dice/Jacard) : 78,56/64,55
Titre (Dice/Jacard) : 36,36/22,22
Desc (Dice/Jacard) : 86,36/76
URL (Dice/Jacard) : 66,67/50
Similar Page Checker : 63

Voilà les résultats de mes tests (loins d'être parfaits je vous l'accorde...) dans ce grand débat qu'est le duplicate content.
Vos observations seront évidemment les bienvenues.
 
WRInaute discret
%%%

Bonjour, justement je ne me risquerai pas à interpréter ces essais, étant donné que les page-tests réalisées n'ont pas été réferencés.
Je ne peux que regarder que les % de similarité donnés et être étonné des différences entre l'outil de WRI et Similar Pages Checker. Les pages dupliquées ayant également beaucoup moins de codes sources, je ne trouve pas de différences flagrantes entre les versions "texte seul" et la version originale, le coed HTML ne compte donc pas pour beaucoup ???
 
WRInaute accro
le code source ne compte pas car il est supprimé très tôt (dans la phase d'indexation je pense) par les moteurs et pas utilisé pour mesurer la pertinence (heureusement) ...

mon expérience sur le sujet montre qu'il faut descendre en dessous 70% pour eviter la désindexation (et la réindexation des pages déjà desindéxées) ... tu as qq discussions sur le sujet, certes un peu anciennes mais cela n'a pas beaucoup évolué sur le sujet, ici rubrique "La similarité de pages (et les problèmes de désindexation)" ...
 
Discussions similaires
Haut