outil de mesure de similarité de 2 pages ...
37 messages
• Page 3 sur 3 • 1, 2, 3
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

Cendrillon - WRInaute accro

- Messages: 4940
- Inscription: 17 Aoû 2004
CS76 a écrit:Voici un outil permettant de mesurer la similarité de deux pages :
-http://www.webconfs.com/similar-page-checker.php
oui, c'est pas mal, sauf que l'on ne sait pas ce qu'il mesure ... j'ai testé avec 2 pages identiques mais dans 2 langues # (Français et Anglais) ... il trouve quand même 41% de similarité !! il doit prendre en compte autre chose que le contenu pour arriver à ce résultat ...
-

mahefarivony - WRInaute accro

- Messages: 11405
- Inscription: 14 Oct 2002
bin on aura au moins appris qu'il existe un index secondaire
... dans lequel sont donc "déversées" toutes nos pages "similaires"...
mais le probleme reste entier : quel est l'algo pour déterminer qu'une page est similaire a une autre ?
amha et pour schématiser la chose, chaque page possède une "note".. si deux notes sont trop similaires, hop direction la poubelle...
cette note prend en compte bien entendu tous nos "artifices" d'optimisation (title, balises, etc.) mais on est bien d'accord que ce qui différencie réellement 2 pages, c'est bien ... leur contenu ?
... dans lequel sont donc "déversées" toutes nos pages "similaires"...
mais le probleme reste entier : quel est l'algo pour déterminer qu'une page est similaire a une autre ?
amha et pour schématiser la chose, chaque page possède une "note".. si deux notes sont trop similaires, hop direction la poubelle...
cette note prend en compte bien entendu tous nos "artifices" d'optimisation (title, balises, etc.) mais on est bien d'accord que ce qui différencie réellement 2 pages, c'est bien ... leur contenu ?
-

Cendrillon - WRInaute accro

- Messages: 4940
- Inscription: 17 Aoû 2004
caro -> tu avais ouvert une discution sur ce sujet me semble t'il ... à quelle conclusion étais tu arrivée ?
- MagicYoyo
- WRInaute accro

- Messages: 2877
- Inscription: 24 Mai 2004
oui, c'est pas mal, sauf que l'on ne sait pas ce qu'il mesure ... j'ai testé avec 2 pages identiques mais dans 2 langues # (Français et Anglais) ... il trouve quand même 41% de similarité !! il doit prendre en compte autre chose que le contenu pour arriver à ce résultat ...
Je pense que justement, cette page compare les codes sources, et pas les contenus "visibles".
-

herveG - Modérateur

- Messages: 9919
- Inscription: 5 Mar 2003
Cendrillon a écrit:caro -> tu avais ouvert une discution sur ce sujet me semble t'il ... à quelle conclusion étais tu arrivée ?
je crois qu´il n´y avait pas vraiment eu de conclusion car tu nous avais dit que deux pages pouvaient etre considérées comme similaires par exemple par la recherche "site:ndd.com" mais qu´elles pouvaient etre considérées non similaires sur une requete déterminée. ce qui avait été vérifié d´ailleurs je crois.
Alors peutetre que google ne considere qu´un seul élément de comparaison et ce serait dépendant de la requete. un peu comme l´affichage de la description dans les resultats :
- soit la balise descritpion
- soit un morceau du contenu comportant la requete.
maintenant une idée : lorsque l on fait site:ndd.com, les resultats retournent le contenu de la balise description en description ou prafois le début de la page.
lorsque l´on fait une recherche sur un terme précis, on peut se voir proposer le contenu de la balise desc (surtout si le terme y est) ou un morceau du contenu (ou plusieurs morceaux meme).
Imaginons alors que la "similitude" se base sur la description fournie par google dans ses resultats...... on pourrait alors comprendre que :
- sur site:ndd.com toutes les pages ayant une balise description identique soient considérées comme similaire (ou alors peutetre ayant un début de page identique) car c est ce qui est retourné en resultat avec cette commande.
- sur une requete "motclé" que ces memes pages ne soient plus considérées similaires car ce mot-clé ne se trouve pas a chaque fois au meme endroit sur les pages, dans un autre contexte, de nouvelles phrases, etc. et donc google ne retourne pas la meme chose a chaque fois en description dans ces résultats...
je m´explique mal, mais je peux recommencer si personne n´a compris....
a+
Hervé
-

Cendrillon - WRInaute accro

- Messages: 4940
- Inscription: 17 Aoû 2004
Noel approche à grands pas ... bientôt de nouveaux outils sur WRI ... 
37 messages
• Page 3 sur 3 • 1, 2, 3
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- outil de similarité défectueux ?
- Outil - Similarité - Densité
- 60% de similarité sur outil WRI, risque DC ?
- [Outil] Calcul de similarité textuelle entre 2 pages web
- Outil de calcule de similarité : dans quel pourcentage peut on parler de duplicate content
- Outil de référencement sur mesure
- cherche outil de mesure d'audience
- Quel est le meilleur outil de mesure Google PR ?
- différents résultats sur différents outil de similarite
- Similarité de pages
- Analyse de similarité textuelle
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués. - Indice de co-occurrence et ratio E/F
Cet outil vous permet de calculer l'indice de co-occurrence de 2 ou 3 termes, ainsi que le ratio E/F. L'indice de co-occurrence mesure le relation entre les termes : plus cet indice est élevé, plus les termes sont reliés. Concrètement, plus l'indice est élevé, plus il est fréquent de trouver des documents qui contiennent les différents termes.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité

