Algorithme de similarité entre deux pages(Duplicate Content)
2 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- TrustRank
- Nouveau WRInaute

- Messages: 21
- Inscription: 31 Mai 2005
Algorithme de similarité entre deux pages(Duplicate Content)
J'utilise actuellement 5 Algorithme différents pour me donner la similarité entre deux pages (Trigramm, Like, Levenshtein, SoundEx et Metaphone).
Connait-on publiquement quel aglorithme google utilise t-il pour calculer la similarité entre deux pages et la classé ou non en duplicate content ?
Bon j'avoue que le calcul de similarité actuelle avec ces 5 algo + moyenne general me donne une valeur qui doit être plutot bonne mais bon... J'aime parfaire mon travail
<troll>J'accepte de partager mon travail contre une rénumération en backlinks PR 10</troll>..........
Connait-on publiquement quel aglorithme google utilise t-il pour calculer la similarité entre deux pages et la classé ou non en duplicate content ?
Bon j'avoue que le calcul de similarité actuelle avec ces 5 algo + moyenne general me donne une valeur qui doit être plutot bonne mais bon... J'aime parfaire mon travail
<troll>J'accepte de partager mon travail contre une rénumération en backlinks PR 10</troll>..........
- MagicYoyo
- WRInaute accro

- Messages: 2877
- Inscription: 24 Mai 2004
Je ne crois pas que l'algo utilisé par Google soit connu. En revanche je suis persuadé que les pages passent par des filtres avant et après (suppression de balises, pondérations...).
Olivier a crée des outils de mesure : http://www.webrankinfo.com/outils/similarite.php
Mais je vois pas comment c'est possible de mesurer les résultats de l'algo utilisé par Google.
Olivier a crée des outils de mesure : http://www.webrankinfo.com/outils/similarite.php
Mais je vois pas comment c'est possible de mesurer les résultats de l'algo utilisé par Google.
2 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Eviter le duplicate content (similarité du contenu)
- Outil de calcule de similarité : dans quel pourcentage peut on parler de duplicate content
- Le Duplicate-Content en question : un cas de duplicate content important non-pénalisé
- Sale duplicate content (pas content du tous !!!!!) !!!
- Duplicate content ou pas duplicate
- [help] duplicate content
- Duplicate content possible ?
- duplicate content again
- pb duplicate content
- .FR + .COM = duplicate content
Consultez la description détaillée des produits ou services de Google suivants : Google TrustRank
- Détection de pages dupliquées
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité
