outil de mesure de similarité de 2 pages ...
37 messages • Page 2 sur 3 • 1, 2, 3
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
-

Cendrillon - WRInaute accro

- Messages: 4747
- Inscription: Mar Aoû 17, 2004 15:41
Webrankinfo a écrit:Tout le problème vient du réglage de l'outil qui pourrait se calquer sur l'un ou l'autre des moteurs. Par exemple si je coche l'option Google, l'outil doit idéalement indiquer la même chose que Google. Problème : comment savoir grâce à Google que 2 pages sont jugées "trop" similaires ? Quand une seule des deux ressort sur une requête, et que pour voir l'autre il faut cliquer sur le lien qui désactive le filtre ? Vos avis m'intéressent...
je ne pensais pas vraiment au problème de pages similaires dans les pages de résultats ... et je ne crois pas que l'on puisse faire grang chose pour cela ... comme tout le monde le sait, les snipets étant générés dynamiquement en fonction du mot clé demandé dans la requète ... une page qui aurait 10% de similarité globale sur la page pourrait se retrouver avec 100% de similarité avec un peu de malchance si l'on se limite uniquement à mesurer sur la zone snipet (ce qui est fait me semble t'il sur les pages de résultats) ...
Non je pensais au taux de similarité globale de la page qui fait que lorsque l'on a trop de page similaire à plus n%, elles commencent alors à perdre leurs descriptions voir a être désindexées ...
WebRankInfo a écrit:mon idée est de demander à mon outil s'il considère que 2 pages sont similaires. Cet outil donnerait un taux de similarité et au-delà d'un certain seuil il décrète les pages similaires.
Tout le problème vient du réglage de l'outil qui pourrait se calquer sur l'un ou l'autre des moteurs. Par exemple si je coche l'option Google, l'outil doit idéalement indiquer la même chose que Google. Problème : comment savoir grâce à Google que 2 pages sont jugées "trop" similaires ? Quand une seule des deux ressort sur une requête, et que pour voir l'autre il faut cliquer sur le lien qui désactive le filtre ? Vos avis m'intéressent...
L'idée me parait géniale, mais je vois une limite à ton raisonement.
Degré de similarité oui, mais sur quels critères ?
- Sur le degré de similarité des codes sources ?
- Sur le degré de similarité du texte visible ? avec ou sans les métas ? avec une pondération alourdissant certains critères ?
Le degré de sensibilité du moteur dépend de la construction de son algorythme d'analyse de la similarité, qui est peut-être complexe...
Est-il envisageable de demander à Google comment ils analysent la similarité de 2 pages ?
Ne serait-ce pas une information bénéfique pour tout le monde ?
-

mahefarivony - WRInaute accro

- Messages: 11405
- Inscription: Lun Oct 14, 2002 10:00
juste une petite info : on a tendance a penser que les pages sans titre ni description ne sont pas prises en compte lors des recherches.. Je vous rassure, ce n'est pas (toujours?) le cas .
exemple :
http://www.google.fr/search?q=site:www. ... rt=60&sa=N
vous verrez en 7eme ligne -http://www.madanight.com/viewarticle_46.htm sans titre ni description.. Vous vous dites : c'est fichu pour cette page..
maintenant en allant sur
http://www.google.fr/search?hl=fr&q=Le+ ... scar&meta=
oh miracle, -http://www.madanight.com/viewarticle_46.htm a retrouvé son titre et sa description.. ouf
exemple :
http://www.google.fr/search?q=site:www. ... rt=60&sa=N
vous verrez en 7eme ligne -http://www.madanight.com/viewarticle_46.htm sans titre ni description.. Vous vous dites : c'est fichu pour cette page..
maintenant en allant sur
http://www.google.fr/search?hl=fr&q=Le+ ... scar&meta=
oh miracle, -http://www.madanight.com/viewarticle_46.htm a retrouvé son titre et sa description.. ouf
-

WebRankInfo - Administrateur du site

- Messages: 15893
- Inscription: Ven Avr 19, 2002 19:51
@MagicYoyo : Google ne donnera jamais une telle information. De mon côté, je propose de fournir une note de similarité textuelle + une note de similarité des liens et éventuellement une note qui cumule les deux. Ensuite on verra à quoi ça peut servir ?
aïe, ce que tu montres Mahé ne va pas nous aider à définir ce qu'on veut vraiment avec cet outil de similarité...
Cendrillon, à la rescousse !
aïe, ce que tu montres Mahé ne va pas nous aider à définir ce qu'on veut vraiment avec cet outil de similarité...
Cendrillon, à la rescousse !
-

Cendrillon - WRInaute accro

- Messages: 4747
- Inscription: Mar Aoû 17, 2004 15:41
mahefarivony a écrit:maintenant en allant sur
http://www.google.fr/search?hl=fr&q=Le+ ... scar&meta=
oh miracle, -http://www.madanight.com/viewarticle_46.htm a retrouvé son titre et sa description.. ouf
certes, mais il a du puiser sa description dans l'index secondaire (résultat compémentaire, date du cache : 10 avr 2004 20:57:51 GMT.) ce qui veut dire qu'il considère (si j'ai bien compris) ta page sans intérêt ... résultat elle ne sortira que sur ce type de requète (4 mots clés) avec à peine 500 réponses ...
sur cette requète par exemple "diaspora madagascar" tu ne sors déjà plus et elle ne fait "que" 67 500 réponses ...
c'est exactement ce que je cherche à éviter ...
-

mahefarivony - WRInaute accro

- Messages: 11405
- Inscription: Lun Oct 14, 2002 10:00
je vais juste faire un petit test si cela ne vous dérange pas
diaspora madagascar
=> j'ai toujours pensé qu'il ne suffit pas d'avoir un SEUL lien pour qu'une page soit considérée comme non "orpheline".. Voyons voir si j'ai raison
diaspora madagascar
=> j'ai toujours pensé qu'il ne suffit pas d'avoir un SEUL lien pour qu'une page soit considérée comme non "orpheline".. Voyons voir si j'ai raison
Dernière édition par mahefarivony le Mer Déc 08, 2004 10:26, édité 1 fois.
-

WebRankInfo - Administrateur du site

- Messages: 15893
- Inscription: Ven Avr 19, 2002 19:51
es-tu sûre que cela vienne d'une trop grande similarité de cette page avec d'autres du même site ?
Mon site est dynamique et la requete qui sort ma Home (seule page indexée) sort un résultat du meme type (pas de titre ni de texte). j'en parle ici : http://www.webrankinfo.com/forums/viewtopic_19183.htm
WebRankInfo a écrit:aïe, ce que tu montres Mahé ne va pas nous aider à définir ce qu'on veut vraiment avec cet outil de similarité...
Je ne comprends pas. Je crois que ce que montre Mahé nous indique, au contraire, ce que similarité veut dire pour Google...
Le contenu de la page "article46" est bien pris en compte par Google, mais il n'est pas affiché dans la première recherche parce qu'il est trop proche de celui d'une page affichée. Comme cette page affichée ne contient pas les mots choisis dans la deuxième recherche, la page "article46" n'a plus de concurrent trop similaire et est affichée.
Yes
Jean-Luc
-

Cendrillon - WRInaute accro

- Messages: 4747
- Inscription: Mar Aoû 17, 2004 15:41
WebRankInfo a écrit:es-tu sûre que cela vienne d'une trop grande similarité de cette page avec d'autres du même site ?
sûre, non ... convaincue, OUI ... évidement ce ne doit pas être la seule cause possible, mais je suis convaincue que s'en est une ... d'ailleurs nous avons eu de nombreux thread sur le sujet ...
mais je laisse les autres intervenants en témoigner éventuellement ...
-

WebRankInfo - Administrateur du site

- Messages: 15893
- Inscription: Ven Avr 19, 2002 19:51
je pense qu'il ne faut pas se baser sur des requêtes incluant la commande site: car on n'est pas sûr que ça utilise les mêmes critères que dans une requête classique.
ce que je vois avec l'exemple de mahé c'est que sa page est effectivement bien prise en compte par Google, par contre elle est sortie en résultats complémentaire pour l'exemple donné.
je sens qu'il va falloir reprendre des exemples de "désindexations" de pages dynamiques.
ce que je vois avec l'exemple de mahé c'est que sa page est effectivement bien prise en compte par Google, par contre elle est sortie en résultats complémentaire pour l'exemple donné.
je sens qu'il va falloir reprendre des exemples de "désindexations" de pages dynamiques.
37 messages • Page 2 sur 3 • 1, 2, 3
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Analyse de pages similaires
- Outil de suggestion de mots sémantiquement proches
- Brevet de Google sur le contenu dupliqué
- La mesure d'audience axée référencement
- Calculer l'indice de co-occurrence et le ratio E/F
- Forum Google Analytics sur WebRankInfo
- Google achète Measure Map
- Mise à jour du générateur de mots clés dans AdWords
- Transformer de simples citations en liens
- Yahoo! Instant Search
- Indice de co-occurrence et ratio E/F
Cet outil vous permet de calculer l'indice de co-occurrence de 2 ou 3 termes, ainsi que le ratio E/F. L'indice de co-occurrence mesure le relation entre les termes : plus cet indice est élevé, plus les termes sont reliés. Concrètement, plus l'indice est élevé, plus il est fréquent de trouver des documents qui contiennent les différents termes.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités






le forum