Taux de similarité entre 2 pages

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics


luchduck
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 14
Inscription: 6 Sep 2007

Re: Taux de similarité entre 2 pages

Message le Mer Jan 25, 2012 23:04

Merci, je suis le forum et les conseils du site régulièrement depuis longtemps mais je n'avais encore jamais participer. J'essayerais d'être désormais plus actifs pour alimenter l'échange de connaissance.

Les pourcentages annoncés plus haut sont calculés avec l'outil d'analyse des similarités de WRI (http://www.webrankinfo.com/outils/similarite.php) et l'outil de webconfs (http://www.webconfs.com/similar-page-checker.php) comme signalés par les intervenants précédents.
Même si ces outils ne calculent pas comme Google, ils me permettent de contrôler grossièrement que le travail de rédaction est assez recherché (après la création / lecture de 100 articles sur des thèmes connexes il est difficile à dire si on ne se répète pas simplement en boucle sur un cycle d'une 20ène...).
Les nombres de caractères sont calculés avec un compteur de lettres en ligne (http://www.compteurdelettres.com).

A bientôt j'espère !

Edito prochainement supprimé : Pour bien commencer, à partir de combien de message pourrais-je utiliser les BBCodes: [url] ?

lambi521
WRInaute impliqué
WRInaute impliqué
 
Messages: 782
Inscription: 15 Juin 2010

Re: Taux de similarité entre 2 pages

Message le Jeu Jan 26, 2012 9:46

Bonjour à tous,

Ce sujet m'intéresse énormément car je suis régulièrement confronté au problème de similarité entre deux pages, mais pas entre 2 sites différents, au sein du même site. Mon site est une boutique en ligne et forcément, la structure des fiches produits est toujours la même dans le catalogue, alors comment faire pour que 2 fiches produits ne soient pas similaires ? Car mes produits n'ont pas beaucoup d'informations textuelles, ce sont des cartouches pour imprimantes majoritairement.

Pouvez-vous me donner des conseils pour que Google traite toute mes fiches produits normalement ? Mon sitemap produit me dit que 95% des pages sont indexées mais quand je regarde dans l'index Google, il me donne 4370 résultats, ce qui est mon nombre de produits pratiquement, seulement si je fais défiler les pages, à la page 70 il me dit "Google à ignoré certaines pages à contenu similaire..." Donc 70 pages x 10 résultats par page = 700 fiches produit OK et le reste en DC interne ?

J'avais déjà connu ce problème au lancement du site et j'avais fait en sorte de les différencier au max en mettant en avant les différences entre les produits comme la référence, le modèle, la description, le code EAN et toutes s'étaient bien faite ré-indexées.

J'ai mis ce nouveau design en ligne la semaine dernière, est-ce queça a pu les faires repasser en DC ? Quels conseils me donnez vous ? Car au niveau textuel il y toutes les informations, faut-il que je supprime ce qui est commun à toutes les pages, c'est à dire des rubriques dans la colonne de gauche par exemple ? Cela reviendrait à réduire le contenu similaire

J'ai essayé l'outil que vous citez plus haut de webconf entre 2 cartouches de marque différente, il me donne 88% de similarité et celui-ci aussi. Par ailleurs, si je tape mon NDD sur Copyscape.com, il y a un résultat et il s'agit de la fiche de l'annuaire compare-le-net.com qui ajoute tout seul une rubrique "aperçu de la page" où il récupère le texte de ma page. Faut-il que je demande sa suppression ?

Merci d'avance pour vos réponses


zeb
WRInaute accro
WRInaute accro
 
Messages: 4569
Inscription: 5 Déc 2004

Re: Taux de similarité entre 2 pages

Message le Jeu Jan 26, 2012 10:39

Le seul truc que j'ai trouvé pour changer ça est de diminuer au maximum les zones fixes (genre menu, footer etc ...) et de maximiser l'apport éditorial.
De toute façon il n'y a pas de secret, si deux pages sont proches il n'y a qu'en augmentant leur différence donc le contenu que tu peux changer les choses.

lambi521
WRInaute impliqué
WRInaute impliqué
 
Messages: 782
Inscription: 15 Juin 2010

Re: Taux de similarité entre 2 pages

Message le Jeu Jan 26, 2012 10:54

Merci pour la réponse,

Concernant copyscape qui me ressort compare-le-net.com, je viens de demander au webmaster de supprimer ma fiche.

As-tu visité mon site ? Que me conseille-tu de supprimer comme "zone identique" sur mes fiches produits ? Je ne peux pas supprimer le menu, de plus je sais que Google sais le détecter et qu'il ne fait pas partie du "contenu similaire" ce qui est totalement normal puisque évidemment le menu est le même sur toutes les pages d'un site :lol:

Je pense qu'il faut que je "taille" ma colonne de gauche de mes fiches, en supprimant quelques boxes par exemple la boxe où il y a le lien pour facebook ? Sur le lien que j'ai mis pour tester la similarité ils disent qu'il faut être en dessous de 80%


zeb
WRInaute accro
WRInaute accro
 
Messages: 4569
Inscription: 5 Déc 2004

Re: Taux de similarité entre 2 pages

Message le Jeu Jan 26, 2012 11:08

lambi521 a écrit:As-tu visité mon site ?

La partie "Fiche détaillée" est trop vide et idem pour "Informations complémentaires" qui devrait contenir beaucoup plus de texte.
Je comprend bien que "pondre" du texte sur une cartouche d'imprimante est relativement "hard" mais cela me semble la seule solution.

Autre chose si (je dis bien si) la quantité de code html entre dans le calcul de similarité de google, alors il serait bon de passer a des template plus performantes et d'externaliser le javascript.

lambi521
WRInaute impliqué
WRInaute impliqué
 
Messages: 782
Inscription: 15 Juin 2010

Re: Taux de similarité entre 2 pages

Message le Jeu Jan 26, 2012 11:25

La partie "Fiche détaillée" est trop vide et idem pour "Informations complémentaires" qui devrait contenir beaucoup plus de texte.
C'est justement ça mon problème, j'ai ajouté la partie "Informations complémentaires" afin de pouvoir répéter les différences qu'il existe entre les nombreuses références. Je vais essayer de rajouter quelques phrases mais je ne vois pas ce qu'il y a à dire de plus...
externaliser le javascript
Qu'entends tu par là ? Mes fichiers .js sont déjà externes à part la fonction du bouton d'ajout au panier.

Comment savoir si Google considère mes fiches produits comme similaires ? Certains disent que Google sait reconnaître un site ecommerce et qu'il en tient compte, d'autres disent même qu'il n'y a pas de Duplicate Content au sein d'un même site...

Difficile de tirer des conclusions


luchduck
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 14
Inscription: 6 Sep 2007

Re: Taux de similarité entre 2 pages

Message le Jeu Jan 26, 2012 11:40

Je dirais que tes informations complémentaires sont trop minces, ainsi tes pages sont considérées comme proche, Google fait donc le trie en les ignorant dans les résultats premiers.
La solution de réduire le contenu fixe me semble bien, associé à un complément d'information plus fournis (au moins 500-800 caractères - ce qui veut peut être dire faire appel à un concepteur-rédacteur pour justement diversifier le plus possible ces textes sur une fond assez proche), l'ajout de commentaire peut éventuellement être une manière d'ajouter un peu de contenu à ces pages, j'opterais aussi pour plus de propositions de produits en lien.


zeb
WRInaute accro
WRInaute accro
 
Messages: 4569
Inscription: 5 Déc 2004

Re: Taux de similarité entre 2 pages

Message le Jeu Jan 26, 2012 13:00

lambi521 a écrit:Qu'entends tu par là ? Mes fichiers .js sont déjà externes à part la fonction du bouton d'ajout au panier.

Je ne sais plus où je suis tombé sur un gros pavé de javascript, mais comme je le dis c'est important si et seulement si l'algo de calcul de similarité prend en compte le code (ce qui me semblerait crétin mais sait on jamais).

Je vais essayer de rajouter quelques phrases mais je ne vois pas ce qu'il y a à dire de plus...

faut trouver des solutions alternatives genre tips "le saviez vous ? bla bla bla ..." (bien sur différents pour chaque produit et ciblé sur le produit).
Tu peut parler de ancres, des chaines de productions, de l'aspect écolo ou pas, passer des infos sur le choix d'un imprimante, des conseil de reciclage etc etc ... Bref c'est pas simple mais ça peut t'aider.

En effet comme le souligne luchduck les avis utilisateurs peuvent être un bon appui (quite a en faire par tois même qulques un cradible (par genre "c'est moi le plus beau")).

lambi521
WRInaute impliqué
WRInaute impliqué
 
Messages: 782
Inscription: 15 Juin 2010

Re: Taux de similarité entre 2 pages

Message le Jeu Jan 26, 2012 14:22

faut trouver des solutions alternatives genre tips "le saviez vous ? bla bla bla ..." (bien sur différents pour chaque produit et ciblé sur le produit)
Différents sur chaque produit... j'en ai 5000... le temps que je finisse Google aura coulé :lol:
En effet comme le souligne luchduck les avis utilisateurs peuvent être un bon appui (quite a en faire par tois même qulques un cradible (par genre "c'est moi le plus beau")
Tu laisserais ton avis sur une cartouche toi ?

Bref il fait ch**r ce panda


luchduck
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 14
Inscription: 6 Sep 2007

Re: Taux de similarité entre 2 pages

Message le Jeu Jan 26, 2012 15:49

Il n'y aura effectivement pas beaucoup de monde qui postera spontanément un commentaire.
Mais regarde par exemple Amazon sur le même produit, tu peux par exemple inciter les acheteurs à laisser un petit commentaire après un achat, ou encore en ajouter par tes propres moyens de manière à gonfler un peu le contenu.
Quoi qu'il en soit je dirais que la solution est le concepteur-rédacteur dans ton cas pour obtenir des descriptions assez pertinentes et plus longues et éviter le suicide après la 4999ème description. Vu le nombre de produit tu va t'en tirer pour assez chère, à voir si ça vaut le coup. + pense aussi aux balises alt des images qui créent de la différence.


zeb
WRInaute accro
WRInaute accro
 
Messages: 4569
Inscription: 5 Déc 2004

Re: Taux de similarité entre 2 pages

Message le Jeu Jan 26, 2012 18:30

lambi521 a écrit:Différents sur chaque produit... j'en ai 5000... le temps que je finisse Google aura coulé :lol:

:D il y a des chances ....
lambi521 a écrit:Tu laisserais ton avis sur une cartouche toi ?

:lol: oui si c'est pour faire chier le modérateur ....

De toute façon si tu ne peux plu diminuer d'un côté et ou augmenter de l'autre t'est maron c'est la quasi seule certitude.

Ou alors tu charge la base des 5000 meilleurs dictons de France et de Navare et tu leur en ajoute un a chaque produit peut être que ça peut faire la farce. :D Genre entre deux achats de cartouche compléter votre culture G. Qui sais tu va peut être gagner la sorbonne comme client.

lambi521
WRInaute impliqué
WRInaute impliqué
 
Messages: 782
Inscription: 15 Juin 2010

Re: Taux de similarité entre 2 pages

Message le Ven Jan 27, 2012 9:08

De toute façon si tu ne peux plu diminuer d'un côté et ou augmenter de l'autre t'est maron c'est la quasi seule certitude.
ça faisait une éternité que je n'avais pas entendu "t'es marron" :lol: lorsque j'avais lancé le site, Google avait tout indexé puis désindéxait les fiches produits petit à petit, j'avais supprimé le plus d'infos en commun (surtout dans la colonne de gauche) et elles avaient été réindéxées petit à petit. Là je viens de mettre le nouveau design où la colonne de gauche est la même sur tout le site, c'est peut-être là le problème. Mais j'ai fait des tests en supprimant des rubriques et le ratio similarité ne décend pas donc je ne comprend pas trop. En plus il faudrait être sûr de la fiabilité de ses outils (ce sont souvent des petits scripts fait à la va vite par des agences de ref pour récupérer des NDD et ensuite démarcher les clients donc...)

Ou alors tu charge la base des 5000 meilleurs dictons de France et de Navare et tu leur en ajoute un a chaque produit peut être que ça peut faire la farce. :D Genre entre deux achats de cartouche compléter votre culture G. Qui sais tu va peut être gagner la sorbonne comme client.
Ca serait un excellent client avec tous les dossiers/rapports/mémoires qu'ils impriment, c'est bon pour le commerce ça :lol:

Mes fiches produits sont bien indexées mais j'ai l'impression qu'elles sont comme "bridées" dans les SERPs, car elles sont optimisées sur les références des produits et parfois je suis 1er, parfois je suis page 4, c'est vraiment dûr à suivre. Mais ce qui me met la puce à l'oreille c'est quand je vois des pages dans les SERPs qui n'ont presque pas de rapport avec la requête mais qui sont devant moi quand même. J'étais mieux placé que ça avant, enfin j'ai l'impression, encore une fois c'est dur de suivre 5000 URLs


zeb
WRInaute accro
WRInaute accro
 
Messages: 4569
Inscription: 5 Déc 2004

Re: Taux de similarité entre 2 pages

Message le Ven Jan 27, 2012 10:45

j'utilise un autre truc pour virer le contenu similaire sur mes sites (genre les truc a la con comme les boutons de réseaux sociaux, le traditionnel "faire un lien" etc ... tout ce qui est répétitif et pas directement lié au contenu) . En fait je place une iframe que je charge en javascript après le chargement complet de la page.

Techniquement si javascript n'est pas exécuté la page se présente sous la forme d'un contenu très ciblé sur le thème de la page, donc a priori c'est ce que voit le moteur en analyse de contenu et le visiteur lui voie en dernier apparaitre ce que je ne souhaite pas voir répété.

Pour le visiteur c'est un gain car la page charge plus vite (le rendu CSS tiens compte de l'espace necessaire aux iframes même si elles sont vide) et il n'est donc pas concerné tout de suite par autre chose que mon contenu (même si dans les faits c'est trop rapide pour qu'il ai le temps d'y voir quoi que ce soit)

pour le contenu disons "optionnel" genre les boutons j'aime etc ... une image clicable hébergée chez moi leur donne le moyen de charger l'iframe réseaux sociaux. Ils n'ont donc accès aux commandes que si ils cliquent sur l'image (gain de temps de chargement, de flicage (puisque rien d'affiché si image pas cliquée))

Il faudrait voir si tu est capable de soustraire des pans importants de tes pages pour y appliquer cette technique. En ne laissant bien sur que les sections vitales. l'avantage serait de ne fournir en premier chargement (ce que va analyser le moteur) que le contenu ciblé. Donc pas forcement beaucoup mais top pertinent et du coup diversifié.

Accessoirement cette technique permet aussi d'économiser des résolutions DNS comme n en voie beaucoup sur les pages faisant appel a de nombreux gadgets faceboobk, tweeter etc ... et ça c'est gros bénef surtout si le service est down ou chargé au moment ou ton internaute consulte la page. (en fait je n'ai plu sur mes pages que du contenu hébergé chez moi avec ça (sauf la pub quand il y en a))


luchduck
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 14
Inscription: 6 Sep 2007

Re: Taux de similarité entre 2 pages

Message le Ven Jan 27, 2012 20:51

J'ai utilisé la technique que tu décris pour afficher en différer un contenu récupéré d'un flux, de manière à ne pas devoir attendre la fin de la récupération pour afficher la page, ça peut être une solution...

Sinon, peut être que le problème vient simplement du fait que ces pages ne devraient pas être des pages puisque tu n'a finalement pas un contenu suffisant pour en faire des pages distinctes. Ne serait-il pas intéressant de faire des pages regroupant plusieurs produits :idea: ?

lambi521
WRInaute impliqué
WRInaute impliqué
 
Messages: 782
Inscription: 15 Juin 2010

Re: Taux de similarité entre 2 pages

Message le Lun Jan 30, 2012 10:12

Pouvez-vous m'aider à comprendre si mon site est en bonne santé ou pas ?

Car je ne sais pas trop comment comprendre tout ça, j'explique :
* dans GWT, sitemap produits -> 4131/4213 (mis à jour régulièrement et toujour en hausse)
* commande site: + allinurl: -> 4410 résultats (mais message "Google a ignoré certaines pages..." page 70) Voir ici

Je précise qu'avant, je n'avais aucun doute sur l'indexation et mes places dans les SERPs de mes fiches produits. Entre le nouveau et l'ancien design, rien a vraiment changé à part l'ajout du fil d'arianne, le changement "graphique" mais ça Google s'en fiche, la modification de la colonne de gauche mais contenu quasi identique à l'ancienne, ajout d'une balise strong sur le nom du produit dans "informations complémentaires", et réduction du code de la page (html, js, css).

Sinon, peut être que le problème vient simplement du fait que ces pages ne devraient pas être des pages puisque tu n'a finalement pas un contenu suffisant pour en faire des pages distinctes.
Ca, c'est Google qui le dit, pas mes clients. Un site marchand a toujours eu une fiche produit par produit, ce qui est normal. Je met tout ce qu'il y a à savoir sur mes produits, jusqu'au code barre que j'ai rajouté ! Google dicte les règles, impose sa vision des sites, on ne fais plus les sites pour les internautes mais pour Google et si en second temp ça plait aux internautes, tant mieux. Je ne trouve pas ça logique.

Peut-être ai-je un probleme dans <title>, dans les H1, H2, H3..? Ou alors c'est un nouveau Panda ? Si je rajoute du texte spinné, pensez-vous que ça le ferais ou pas ? Car il y a toujours des mots qui seront commun, comme à l'heure actuelle, dans "informations complémentaires". Des conseils à me donner ,

Taux de similarité entre 2 pages

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Calcul du taux de liens vers des pages internes
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.
  • Détection de pages similaires
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.


Qui est en ligne

Utilisateurs parcourant ce forum: abousa3d, cupidonbe, Oscar-Paradi'SEO et 0 invités