Algorithme de similarité entre deux pages(Duplicate Content)

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

TrustRank
Nouveau WRInaute
 
Messages: 21
Inscription: Mar Mai 31, 2005 21:24

Algorithme de similarité entre deux pages(Duplicate Content)

Message le Jeu Juin 02, 2005 11:39

J'utilise actuellement 5 Algorithme différents pour me donner la similarité entre deux pages (Trigramm, Like, Levenshtein, SoundEx et Metaphone).

Connait-on publiquement quel aglorithme google utilise t-il pour calculer la similarité entre deux pages et la classé ou non en duplicate content ?

Bon j'avoue que le calcul de similarité actuelle avec ces 5 algo + moyenne general me donne une valeur qui doit être plutot bonne mais bon... J'aime parfaire mon travail

<troll>J'accepte de partager mon travail contre une rénumération en backlinks PR 10</troll>.......... :-)


MagicYoyo
WRInaute accro
WRInaute accro
 
Messages: 2554
Inscription: Lun Mai 24, 2004 15:33

Message le Jeu Juin 02, 2005 14:53

Je ne crois pas que l'algo utilisé par Google soit connu. En revanche je suis persuadé que les pages passent par des filtres avant et après (suppression de balises, pondérations...).
Olivier a crée des outils de mesure : http://www.webrankinfo.com/outils/similarite.php
Mais je vois pas comment c'est possible de mesurer les résultats de l'algo utilisé par Google.


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google TrustRank

  • Détection de pages dupliquées
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités