outil de mesure de similarité de 2 pages ...

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics


Cendrillon
WRInaute accro
WRInaute accro
 
Messages: 4940
Inscription: 17 Aoû 2004

Message le Jeu Déc 09, 2004 0:29

CS76 a écrit:Voici un outil permettant de mesurer la similarité de deux pages :

-http://www.webconfs.com/similar-page-checker.php

oui, c'est pas mal, sauf que l'on ne sait pas ce qu'il mesure ... j'ai testé avec 2 pages identiques mais dans 2 langues # (Français et Anglais) ... il trouve quand même 41% de similarité !! il doit prendre en compte autre chose que le contenu pour arriver à ce résultat ... :wink:

caro
WRInaute impliqué
WRInaute impliqué
 
Messages: 871
Inscription: 21 Juil 2003

Message le Jeu Déc 09, 2004 18:28

l'exemple de Mahé est un vrai casse tête,
je ne m'étais jamais rendu compte de celà auparavant.
trop bizarre :?


mahefarivony
WRInaute accro
WRInaute accro
 
Messages: 11405
Inscription: 14 Oct 2002

Message le Jeu Déc 09, 2004 19:56

bin on aura au moins appris qu'il existe un index secondaire :-)
... dans lequel sont donc "déversées" toutes nos pages "similaires"...
mais le probleme reste entier : quel est l'algo pour déterminer qu'une page est similaire a une autre ?
amha et pour schématiser la chose, chaque page possède une "note".. si deux notes sont trop similaires, hop direction la poubelle...
cette note prend en compte bien entendu tous nos "artifices" d'optimisation (title, balises, etc.) mais on est bien d'accord que ce qui différencie réellement 2 pages, c'est bien ... leur contenu ? :-)


Cendrillon
WRInaute accro
WRInaute accro
 
Messages: 4940
Inscription: 17 Aoû 2004

Message le Ven Déc 10, 2004 0:49

caro -> tu avais ouvert une discution sur ce sujet me semble t'il ... à quelle conclusion étais tu arrivée ?

MagicYoyo
WRInaute accro
WRInaute accro
 
Messages: 2877
Inscription: 24 Mai 2004

Message le Ven Déc 10, 2004 9:19

oui, c'est pas mal, sauf que l'on ne sait pas ce qu'il mesure ... j'ai testé avec 2 pages identiques mais dans 2 langues # (Français et Anglais) ... il trouve quand même 41% de similarité !! il doit prendre en compte autre chose que le contenu pour arriver à ce résultat ... :wink:


Je pense que justement, cette page compare les codes sources, et pas les contenus "visibles".


herveG
Modérateur
Modérateur
 
Messages: 9919
Inscription: 5 Mar 2003

Message le Ven Déc 10, 2004 10:42

Cendrillon a écrit:caro -> tu avais ouvert une discution sur ce sujet me semble t'il ... à quelle conclusion étais tu arrivée ?


je crois qu´il n´y avait pas vraiment eu de conclusion car tu nous avais dit que deux pages pouvaient etre considérées comme similaires par exemple par la recherche "site:ndd.com" mais qu´elles pouvaient etre considérées non similaires sur une requete déterminée. ce qui avait été vérifié d´ailleurs je crois.

Alors peutetre que google ne considere qu´un seul élément de comparaison et ce serait dépendant de la requete. un peu comme l´affichage de la description dans les resultats :

- soit la balise descritpion
- soit un morceau du contenu comportant la requete.

maintenant une idée : lorsque l on fait site:ndd.com, les resultats retournent le contenu de la balise description en description ou prafois le début de la page.

lorsque l´on fait une recherche sur un terme précis, on peut se voir proposer le contenu de la balise desc (surtout si le terme y est) ou un morceau du contenu (ou plusieurs morceaux meme).

Imaginons alors que la "similitude" se base sur la description fournie par google dans ses resultats...... on pourrait alors comprendre que :

- sur site:ndd.com toutes les pages ayant une balise description identique soient considérées comme similaire (ou alors peutetre ayant un début de page identique) car c est ce qui est retourné en resultat avec cette commande.

- sur une requete "motclé" que ces memes pages ne soient plus considérées similaires car ce mot-clé ne se trouve pas a chaque fois au meme endroit sur les pages, dans un autre contexte, de nouvelles phrases, etc. et donc google ne retourne pas la meme chose a chaque fois en description dans ces résultats...

je m´explique mal, mais je peux recommencer si personne n´a compris....

a+
Hervé


Cendrillon
WRInaute accro
WRInaute accro
 
Messages: 4940
Inscription: 17 Aoû 2004

Message le Dim Déc 12, 2004 19:40

Noel approche à grands pas ... bientôt de nouveaux outils sur WRI ... 8)

outil de mesure de similarité de 2 pages ...

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Analyse de similarité textuelle
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
  • Indice de co-occurrence et ratio E/F
    Cet outil vous permet de calculer l'indice de co-occurrence de 2 ou 3 termes, ainsi que le ratio E/F. L'indice de co-occurrence mesure le relation entre les termes : plus cet indice est élevé, plus les termes sont reliés. Concrètement, plus l'indice est élevé, plus il est fréquent de trouver des documents qui contiennent les différents termes.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité