Taux de similarité entre 2 pages
60 messages
• Page 1 sur 4 • 1, 2, 3, 4
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- gatcweb
- WRInaute occasionnel

- Messages: 296
- Inscription: 5 Mai 2004
Taux de similarité entre 2 pages
Bonjour,
Je viens de découvrir "Similar Page checker" : http://www.webconfs.com/similar-page-checker.php qui permet de tester la similarité entre 2 pages.
J'ai testé et oups 2 de mes pages sont similaires à 92%.
Selon vous, à partir de quel taux de similarité Google considère-t-il 2 pages comme identique ? 70%, 80 %, 90% ou 100 % ?
Et quels en sont les risques ? blaklistage ?
PS : connaissez-vous d'autre URL permettant ce type de test ?
Merci
Je viens de découvrir "Similar Page checker" : http://www.webconfs.com/similar-page-checker.php qui permet de tester la similarité entre 2 pages.
J'ai testé et oups 2 de mes pages sont similaires à 92%.
Selon vous, à partir de quel taux de similarité Google considère-t-il 2 pages comme identique ? 70%, 80 %, 90% ou 100 % ?
Et quels en sont les risques ? blaklistage ?
PS : connaissez-vous d'autre URL permettant ce type de test ?
Merci
-

herveG - Modérateur

- Messages: 9919
- Inscription: 5 Mar 2003
est ce que tu as comparé avec "ton oeil à toi" ces deux pages et reconnais-tu que ces deux pages peuvent etre similaire a 92% ?
Quels critères semblent retenus pour arriver à 92% ? en d autres termes, as-tu reussi a identifier quels sont les 8% de difference entre ces deux pages ?
a+
Quels critères semblent retenus pour arriver à 92% ? en d autres termes, as-tu reussi a identifier quels sont les 8% de difference entre ces deux pages ?
a+
- Jaunalgi
- WRInaute occasionnel

- Messages: 303
- Inscription: 11 Aoû 2004
J'ai fait le test sur deux pages identique à l'exception d'un texte de 600 caractères différents sur les deux pages et d'un formulaire de contact. J'obtiens 71%. A première vue, le taux me parait assez bas (j'aurais tablé sur 85% identique)
100% en comparant les deux mêmes pages (on sait jamais
)
et 5% en comparant une page de mon site à une 404.
100% en comparant les deux mêmes pages (on sait jamais
et 5% en comparant une page de mon site à une 404.
- Jaunalgi
- WRInaute occasionnel

- Messages: 303
- Inscription: 11 Aoû 2004
Jaunalgi a écrit:J'ai fait le test sur deux pages identique à l'exception d'un texte de 600 caractères différents sur les deux pages et d'un formulaire de contact. J'obtiens 71%. A première vue, le taux me parait assez bas (j'aurais tablé sur 85% identique)
100% en comparant les deux mêmes pages (on sait jamais)
et 5% en comparant une page de mon site à une 404.
Message passé après mike006. Un bug dans l'heure?
-

mike006 - WRInaute occasionnel

- Messages: 475
- Inscription: 20 Mar 2004
Je viens de découvrir "Similar Page checker" : http://www.webconfs.com/similar-page-checker.php qui permet de tester la similarité entre 2 pages.
C'est en tout cas un outil très intéressant que je ne connaissais pas, je ne pense pas que le risque avec un taux élevé soit le blacklistage, en effet pour certaines pages (dans mon cas description sommaire de photos) c'est très difficile de rendre les pages différentes les unes des autres ; par contre google peut ignorer certaines de ces pages trop semblables.
Je serai toutefois curieux de connaître moi aussi le "seuil" critique.
-

WebRankInfo - Administrateur du site

- Messages: 18958
- Inscription: 19 Avr 2002
benjiiim a écrit:Cet outil ne me semble pas pertinent dutout, en effet, il ne prend pas en compte le texte soit le texte normal soit les alts ou les balises meta par exemple.
pourrais-tu préciser ce que tu veux dire car ce n'est pas assez clair (pour moi)... Merci
- gatcweb
- WRInaute occasionnel

- Messages: 296
- Inscription: 5 Mai 2004
Je ne pense pas, moi aussi, que le risque soit le blacklistage, mais plutôt une mise à l'écart de certaines pages pour "duplicate content". C'est pour cela que je me posais la question de connaître le "seuil critique".
Du coup, je me pose une autre question : combien faut-il au minimum de mots différents dans une page ?
Du coup, je me pose une autre question : combien faut-il au minimum de mots différents dans une page ?
-

mike006 - WRInaute occasionnel

- Messages: 475
- Inscription: 20 Mar 2004
En effet, j'ai comparé deux pages de mon site qui sont en fait les mêmes dans deux langues différentes et il me dit qu'elles sont similaires à 100%.
J'ai fait l'expérience sur 2 pages français anglais mêmes images mais texte différent, résultat : 61 %.
Peut-être parce que j'ai pas mal de texte ? Tu en as bcp toi ?
- weborientalpointcom
- WRInaute discret

- Messages: 90
- Inscription: 17 Avr 2004
Re: Taux de similarité entre 2 pages
gatcweb a écrit:Bonjour,
Je viens de découvrir "Similar Page checker" : http://www.webconfs.com/similar-page-checker.php qui permet de tester la similarité entre 2 pages.
J'ai testé et oups 2 de mes pages sont similaires à 92%.
Selon vous, à partir de quel taux de similarité Google considère-t-il 2 pages comme identique ? 70%, 80 %, 90% ou 100 % ?
Et quels en sont les risques ? blaklistage ?
PS : connaissez-vous d'autre URL permettant ce type de test ?
Merci
bonjour,
tu veux du 100% ?
il te suffit d'un simple meta http-equiv="refresh" content="la page de renvoi".
Et pourtant les 2 pages n'ont absolument aucune similitude.
A+
- parisien94
- WRInaute discret

- Messages: 129
- Inscription: 13 Juil 2004
Ce qui est interessant dans le sujet, c'est de savoir a partir de combien de % google renvoie des pages en pages similaires. Pou ma part, j'ai constaté que c'etait dans la premiere partie du code source que cela se jouait, et que le fait de changer des descriptions, keyword et quelques textes en haut de pages pouvaient faire revenir des pages similaires en pages normales. Mais aucune idée du %.
-

Cendrillon - WRInaute accro

- Messages: 4940
- Inscription: 17 Aoû 2004
attention à ne pas confondre :
- la mesure du taux de similarité entre 2 pages complètes (utilisée pour déterminer s'il y a "duplicate content"),
et
- la mesure du taux de similarité entre 2 snipets qui permet de déterminer si une page doit être affichée ou ignorée car "à contenu similaire" (pour une requete donnée) et débouchant sur un message du type :
"Pour limiter les résultats aux pages les plus pertinentes (total : xx), Google a ignoré certaines pages à contenu similaire.
Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées."
tu peux très bien avoir 5% de contenu similaire entre 2 page et 100% de contenu similaire entre les 2 snipets de ces même pages (les snipets étant je le rappelle contruits dynamiquement en fonction de ta requete, sauf avec la cde "site" où il prend la description et/ou les textes du haut de la page, en tout cas dans le source) ...
- la mesure du taux de similarité entre 2 pages complètes (utilisée pour déterminer s'il y a "duplicate content"),
et
- la mesure du taux de similarité entre 2 snipets qui permet de déterminer si une page doit être affichée ou ignorée car "à contenu similaire" (pour une requete donnée) et débouchant sur un message du type :
"Pour limiter les résultats aux pages les plus pertinentes (total : xx), Google a ignoré certaines pages à contenu similaire.
Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées."
tu peux très bien avoir 5% de contenu similaire entre 2 page et 100% de contenu similaire entre les 2 snipets de ces même pages (les snipets étant je le rappelle contruits dynamiquement en fonction de ta requete, sauf avec la cde "site" où il prend la description et/ou les textes du haut de la page, en tout cas dans le source) ...
-

benjiiim - WRInaute discret

- Messages: 69
- Inscription: 9 Jan 2004
WebRankInfo a écrit:benjiiim a écrit:Cet outil ne me semble pas pertinent dutout, en effet, il ne prend pas en compte le texte soit le texte normal soit les alts ou les balises meta par exemple.
pourrais-tu préciser ce que tu veux dire car ce n'est pas assez clair (pour moi)... Merci
En fait, j'ai du faire une erreur dans mon test tout à l'heure...
désolé
60 messages
• Page 1 sur 4 • 1, 2, 3, 4
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Similarité de pages
- Taux de rebond et taux de sortie
- outil de similarité défectueux ?
- Taux de rebond VS Taux de sortie
- Similarité de 2 pages ? Blacklistage ?
- Outil - Similarité - Densité
- Recherche d'images par similarité
- Annuaire musical par similarité
- Calcul de similarité entre 2 pages
- outil de mesure de similarité de 2 pages ...
- Calcul du taux de liens vers des pages internes
Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés. - Détection de pages similaires
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité
