Taux de similarité entre 2 pages

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

gatcweb
WRInaute impliqué
WRInaute impliqué
 
Messages: 295
Inscription: Mer Mai 05, 2004 7:05

Taux de similarité entre 2 pages

Message le Jeu Jan 20, 2005 9:41

Bonjour,

Je viens de découvrir "Similar Page checker" : http://www.webconfs.com/similar-page-checker.php qui permet de tester la similarité entre 2 pages.

J'ai testé et oups 2 de mes pages sont similaires à 92%.

Selon vous, à partir de quel taux de similarité Google considère-t-il 2 pages comme identique ? 70%, 80 %, 90% ou 100 % ?
Et quels en sont les risques ? blaklistage ?

PS : connaissez-vous d'autre URL permettant ce type de test ?

Merci


herveG
Modérateur
Modérateur
 
Messages: 9817
Inscription: Mer Mar 05, 2003 11:33

Message le Jeu Jan 20, 2005 10:37

est ce que tu as comparé avec "ton oeil à toi" ces deux pages et reconnais-tu que ces deux pages peuvent etre similaire a 92% ?

Quels critères semblent retenus pour arriver à 92% ? en d autres termes, as-tu reussi a identifier quels sont les 8% de difference entre ces deux pages ?

a+

gatcweb
WRInaute impliqué
WRInaute impliqué
 
Messages: 295
Inscription: Mer Mai 05, 2004 7:05

Message le Jeu Jan 20, 2005 11:02

J'ai peu de texte et j'emploie pratiquement les mêmes mots pour la des cription de 2 produits similaires.

gatcweb
WRInaute impliqué
WRInaute impliqué
 
Messages: 295
Inscription: Mer Mai 05, 2004 7:05

Message le Jeu Jan 20, 2005 11:06

OUPS !
Dernière édition par gatcweb le Jeu Jan 20, 2005 11:13, édité 1 fois.

Jaunalgi
WRInaute impliqué
WRInaute impliqué
 
Messages: 293
Inscription: Mer Aoû 11, 2004 11:05

Message le Jeu Jan 20, 2005 11:08

J'ai fait le test sur deux pages identique à l'exception d'un texte de 600 caractères différents sur les deux pages et d'un formulaire de contact. J'obtiens 71%. A première vue, le taux me parait assez bas (j'aurais tablé sur 85% identique)

100% en comparant les deux mêmes pages (on sait jamais :lol: )
et 5% en comparant une page de mon site à une 404.

Jaunalgi
WRInaute impliqué
WRInaute impliqué
 
Messages: 293
Inscription: Mer Aoû 11, 2004 11:05

Message le Jeu Jan 20, 2005 11:10

Jaunalgi a écrit:J'ai fait le test sur deux pages identique à l'exception d'un texte de 600 caractères différents sur les deux pages et d'un formulaire de contact. J'obtiens 71%. A première vue, le taux me parait assez bas (j'aurais tablé sur 85% identique)

100% en comparant les deux mêmes pages (on sait jamais :lol: )
et 5% en comparant une page de mon site à une 404.

Message passé après mike006. Un bug dans l'heure?


benjiiim
WRInaute discret
WRInaute discret
 
Messages: 66
Inscription: Ven Jan 09, 2004 22:54

Message le Jeu Jan 20, 2005 11:10

Salut,

Oups, désolé, mais j'avais fais une petite erreur :oops: :wink:

@+
Dernière édition par benjiiim le Jeu Jan 20, 2005 13:46, édité 1 fois.


mike006
WRInaute impliqué
WRInaute impliqué
 
Messages: 455
Inscription: Sam Mar 20, 2004 10:18

Message le Jeu Jan 20, 2005 11:16

Je viens de découvrir "Similar Page checker" : http://www.webconfs.com/similar-page-checker.php qui permet de tester la similarité entre 2 pages.

C'est en tout cas un outil très intéressant que je ne connaissais pas, je ne pense pas que le risque avec un taux élevé soit le blacklistage, en effet pour certaines pages (dans mon cas description sommaire de photos) c'est très difficile de rendre les pages différentes les unes des autres ; par contre google peut ignorer certaines de ces pages trop semblables.
Je serai toutefois curieux de connaître moi aussi le "seuil" critique.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15839
Inscription: Ven Avr 19, 2002 19:51

Message le Jeu Jan 20, 2005 11:26

benjiiim a écrit:Cet outil ne me semble pas pertinent dutout, en effet, il ne prend pas en compte le texte soit le texte normal soit les alts ou les balises meta par exemple.

pourrais-tu préciser ce que tu veux dire car ce n'est pas assez clair (pour moi)... Merci

gatcweb
WRInaute impliqué
WRInaute impliqué
 
Messages: 295
Inscription: Mer Mai 05, 2004 7:05

Message le Jeu Jan 20, 2005 11:26

Je ne pense pas, moi aussi, que le risque soit le blacklistage, mais plutôt une mise à l'écart de certaines pages pour "duplicate content". C'est pour cela que je me posais la question de connaître le "seuil critique".

Du coup, je me pose une autre question : combien faut-il au minimum de mots différents dans une page ?


mike006
WRInaute impliqué
WRInaute impliqué
 
Messages: 455
Inscription: Sam Mar 20, 2004 10:18

Message le Jeu Jan 20, 2005 11:29

En effet, j'ai comparé deux pages de mon site qui sont en fait les mêmes dans deux langues différentes et il me dit qu'elles sont similaires à 100%.

J'ai fait l'expérience sur 2 pages français anglais mêmes images mais texte différent, résultat : 61 %.
Peut-être parce que j'ai pas mal de texte ? Tu en as bcp toi ?

weborientalpointcom
WRInaute discret
WRInaute discret
 
Messages: 90
Inscription: Sam Avr 17, 2004 8:29

Re: Taux de similarité entre 2 pages

Message le Jeu Jan 20, 2005 11:33

gatcweb a écrit:Bonjour,

Je viens de découvrir "Similar Page checker" : http://www.webconfs.com/similar-page-checker.php qui permet de tester la similarité entre 2 pages.

J'ai testé et oups 2 de mes pages sont similaires à 92%.

Selon vous, à partir de quel taux de similarité Google considère-t-il 2 pages comme identique ? 70%, 80 %, 90% ou 100 % ?
Et quels en sont les risques ? blaklistage ?

PS : connaissez-vous d'autre URL permettant ce type de test ?

Merci


bonjour,
tu veux du 100% ?
il te suffit d'un simple meta http-equiv="refresh" content="la page de renvoi".
Et pourtant les 2 pages n'ont absolument aucune similitude.
A+

parisien94
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 129
Inscription: Mar Juil 13, 2004 14:59

Message le Jeu Jan 20, 2005 11:49

Ce qui est interessant dans le sujet, c'est de savoir a partir de combien de % google renvoie des pages en pages similaires. Pou ma part, j'ai constaté que c'etait dans la premiere partie du code source que cela se jouait, et que le fait de changer des descriptions, keyword et quelques textes en haut de pages pouvaient faire revenir des pages similaires en pages normales. Mais aucune idée du %.


Cendrillon
WRInaute accro
WRInaute accro
 
Messages: 4747
Inscription: Mar Aoû 17, 2004 15:41

Message le Jeu Jan 20, 2005 12:02

attention à ne pas confondre :
- la mesure du taux de similarité entre 2 pages complètes (utilisée pour déterminer s'il y a "duplicate content"),
et
- la mesure du taux de similarité entre 2 snipets qui permet de déterminer si une page doit être affichée ou ignorée car "à contenu similaire" (pour une requete donnée) et débouchant sur un message du type :

"Pour limiter les résultats aux pages les plus pertinentes (total : xx), Google a ignoré certaines pages à contenu similaire.
Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées.
"

tu peux très bien avoir 5% de contenu similaire entre 2 page et 100% de contenu similaire entre les 2 snipets de ces même pages (les snipets étant je le rappelle contruits dynamiquement en fonction de ta requete, sauf avec la cde "site" où il prend la description et/ou les textes du haut de la page, en tout cas dans le source) ... :wink:


benjiiim
WRInaute discret
WRInaute discret
 
Messages: 66
Inscription: Ven Jan 09, 2004 22:54

Message le Jeu Jan 20, 2005 13:48

WebRankInfo a écrit:
benjiiim a écrit:Cet outil ne me semble pas pertinent dutout, en effet, il ne prend pas en compte le texte soit le texte normal soit les alts ou les balises meta par exemple.

pourrais-tu préciser ce que tu veux dire car ce n'est pas assez clair (pour moi)... Merci


En fait, j'ai du faire une erreur dans mon test tout à l'heure... :oops: :wink:
désolé

Taux de similarité entre 2 pages

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Calcul du taux de liens vers des pages internes
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités