Taux de similarité entre 2 pages
43 messages • Page 1 sur 3 • 1, 2, 3
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Taux de similarité entre 2 pages
Bonjour,
Je viens de découvrir "Similar Page checker" : http://www.webconfs.com/similar-page-checker.php qui permet de tester la similarité entre 2 pages.
J'ai testé et oups 2 de mes pages sont similaires à 92%.
Selon vous, à partir de quel taux de similarité Google considère-t-il 2 pages comme identique ? 70%, 80 %, 90% ou 100 % ?
Et quels en sont les risques ? blaklistage ?
PS : connaissez-vous d'autre URL permettant ce type de test ?
Merci
Je viens de découvrir "Similar Page checker" : http://www.webconfs.com/similar-page-checker.php qui permet de tester la similarité entre 2 pages.
J'ai testé et oups 2 de mes pages sont similaires à 92%.
Selon vous, à partir de quel taux de similarité Google considère-t-il 2 pages comme identique ? 70%, 80 %, 90% ou 100 % ?
Et quels en sont les risques ? blaklistage ?
PS : connaissez-vous d'autre URL permettant ce type de test ?
Merci
est ce que tu as comparé avec "ton oeil à toi" ces deux pages et reconnais-tu que ces deux pages peuvent etre similaire a 92% ?
Quels critères semblent retenus pour arriver à 92% ? en d autres termes, as-tu reussi a identifier quels sont les 8% de difference entre ces deux pages ?
a+
Quels critères semblent retenus pour arriver à 92% ? en d autres termes, as-tu reussi a identifier quels sont les 8% de difference entre ces deux pages ?
a+
J'ai fait le test sur deux pages identique à l'exception d'un texte de 600 caractères différents sur les deux pages et d'un formulaire de contact. J'obtiens 71%. A première vue, le taux me parait assez bas (j'aurais tablé sur 85% identique)
100% en comparant les deux mêmes pages (on sait jamais
)
et 5% en comparant une page de mon site à une 404.
100% en comparant les deux mêmes pages (on sait jamais
et 5% en comparant une page de mon site à une 404.
Jaunalgi a écrit:J'ai fait le test sur deux pages identique à l'exception d'un texte de 600 caractères différents sur les deux pages et d'un formulaire de contact. J'obtiens 71%. A première vue, le taux me parait assez bas (j'aurais tablé sur 85% identique)
100% en comparant les deux mêmes pages (on sait jamais)
et 5% en comparant une page de mon site à une 404.
Message passé après mike006. Un bug dans l'heure?
Je viens de découvrir "Similar Page checker" : http://www.webconfs.com/similar-page-checker.php qui permet de tester la similarité entre 2 pages.
C'est en tout cas un outil très intéressant que je ne connaissais pas, je ne pense pas que le risque avec un taux élevé soit le blacklistage, en effet pour certaines pages (dans mon cas description sommaire de photos) c'est très difficile de rendre les pages différentes les unes des autres ; par contre google peut ignorer certaines de ces pages trop semblables.
Je serai toutefois curieux de connaître moi aussi le "seuil" critique.
-

WebRankInfo - Administrateur du site

- Messages: 15839
- Inscription: Ven Avr 19, 2002 19:51
benjiiim a écrit:Cet outil ne me semble pas pertinent dutout, en effet, il ne prend pas en compte le texte soit le texte normal soit les alts ou les balises meta par exemple.
pourrais-tu préciser ce que tu veux dire car ce n'est pas assez clair (pour moi)... Merci
Je ne pense pas, moi aussi, que le risque soit le blacklistage, mais plutôt une mise à l'écart de certaines pages pour "duplicate content". C'est pour cela que je me posais la question de connaître le "seuil critique".
Du coup, je me pose une autre question : combien faut-il au minimum de mots différents dans une page ?
Du coup, je me pose une autre question : combien faut-il au minimum de mots différents dans une page ?
En effet, j'ai comparé deux pages de mon site qui sont en fait les mêmes dans deux langues différentes et il me dit qu'elles sont similaires à 100%.
J'ai fait l'expérience sur 2 pages français anglais mêmes images mais texte différent, résultat : 61 %.
Peut-être parce que j'ai pas mal de texte ? Tu en as bcp toi ?
- weborientalpointcom
- WRInaute discret

- Messages: 90
- Inscription: Sam Avr 17, 2004 8:29
Re: Taux de similarité entre 2 pages
gatcweb a écrit:Bonjour,
Je viens de découvrir "Similar Page checker" : http://www.webconfs.com/similar-page-checker.php qui permet de tester la similarité entre 2 pages.
J'ai testé et oups 2 de mes pages sont similaires à 92%.
Selon vous, à partir de quel taux de similarité Google considère-t-il 2 pages comme identique ? 70%, 80 %, 90% ou 100 % ?
Et quels en sont les risques ? blaklistage ?
PS : connaissez-vous d'autre URL permettant ce type de test ?
Merci
bonjour,
tu veux du 100% ?
il te suffit d'un simple meta http-equiv="refresh" content="la page de renvoi".
Et pourtant les 2 pages n'ont absolument aucune similitude.
A+
- parisien94
- WRInaute occasionnel

- Messages: 129
- Inscription: Mar Juil 13, 2004 14:59
Ce qui est interessant dans le sujet, c'est de savoir a partir de combien de % google renvoie des pages en pages similaires. Pou ma part, j'ai constaté que c'etait dans la premiere partie du code source que cela se jouait, et que le fait de changer des descriptions, keyword et quelques textes en haut de pages pouvaient faire revenir des pages similaires en pages normales. Mais aucune idée du %.
-

Cendrillon - WRInaute accro

- Messages: 4747
- Inscription: Mar Aoû 17, 2004 15:41
attention à ne pas confondre :
- la mesure du taux de similarité entre 2 pages complètes (utilisée pour déterminer s'il y a "duplicate content"),
et
- la mesure du taux de similarité entre 2 snipets qui permet de déterminer si une page doit être affichée ou ignorée car "à contenu similaire" (pour une requete donnée) et débouchant sur un message du type :
"Pour limiter les résultats aux pages les plus pertinentes (total : xx), Google a ignoré certaines pages à contenu similaire.
Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées."
tu peux très bien avoir 5% de contenu similaire entre 2 page et 100% de contenu similaire entre les 2 snipets de ces même pages (les snipets étant je le rappelle contruits dynamiquement en fonction de ta requete, sauf avec la cde "site" où il prend la description et/ou les textes du haut de la page, en tout cas dans le source) ...
- la mesure du taux de similarité entre 2 pages complètes (utilisée pour déterminer s'il y a "duplicate content"),
et
- la mesure du taux de similarité entre 2 snipets qui permet de déterminer si une page doit être affichée ou ignorée car "à contenu similaire" (pour une requete donnée) et débouchant sur un message du type :
"Pour limiter les résultats aux pages les plus pertinentes (total : xx), Google a ignoré certaines pages à contenu similaire.
Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées."
tu peux très bien avoir 5% de contenu similaire entre 2 page et 100% de contenu similaire entre les 2 snipets de ces même pages (les snipets étant je le rappelle contruits dynamiquement en fonction de ta requete, sauf avec la cde "site" où il prend la description et/ou les textes du haut de la page, en tout cas dans le source) ...
WebRankInfo a écrit:benjiiim a écrit:Cet outil ne me semble pas pertinent dutout, en effet, il ne prend pas en compte le texte soit le texte normal soit les alts ou les balises meta par exemple.
pourrais-tu préciser ce que tu veux dire car ce n'est pas assez clair (pour moi)... Merci
En fait, j'ai du faire une erreur dans mon test tout à l'heure...
désolé
43 messages • Page 1 sur 3 • 1, 2, 3
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Analyse de pages similaires
- Calcul du ratio de liens profonds vers un site web
- Annonces illustrées Google Adsense
- Brevet de Google sur le contenu dupliqué
- Outil de suggestion de mots sémantiquement proches
- AdSense : des AdWords sur vos sites
- Les annonces illustrées de Google AdSense
- Améliorer le taux de conversion : la clé de la réussite !
- Comment l'internaute utilise les moteurs de recherche
- Brevet de Microsoft sur l'analyse des textes de backlinks
- Similarité de 2 pages ? Blacklistage ?
- Outil - Similarité - Densité
- Annuaire musical par similarité
- Calcul de similarité entre 2 pages
- outil de mesure de similarité de 2 pages ...
- Similarité de contenu et bug commande site:
- Similarité entre 2 sites > résultats complémentaires
- Eviter le duplicate content (similarité du contenu)
- danger similarite entre les urls
- Similarité des pages : je vais m'évanouir !!!!!
- Peur sur la similarité entre mes pages
- [Demande Technique] Similarité entre ces 2 textes : 94% !!!
- Algorithme de similarité entre deux pages(Duplicate Content)
- [Outil] Calcul de similarité textuelle entre 2 pages web
- différents résultats sur différents outil de similarite
- Calcul du taux de liens vers des pages internes
Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités






le forum