outil de mesure de similarité de 2 pages ...

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


Cendrillon
WRInaute accro
WRInaute accro
 
Messages: 4747
Inscription: Mar Aoû 17, 2004 15:41

Message le Mar Déc 07, 2004 19:31

Webrankinfo a écrit:Tout le problème vient du réglage de l'outil qui pourrait se calquer sur l'un ou l'autre des moteurs. Par exemple si je coche l'option Google, l'outil doit idéalement indiquer la même chose que Google. Problème : comment savoir grâce à Google que 2 pages sont jugées "trop" similaires ? Quand une seule des deux ressort sur une requête, et que pour voir l'autre il faut cliquer sur le lien qui désactive le filtre ? Vos avis m'intéressent...

je ne pensais pas vraiment au problème de pages similaires dans les pages de résultats ... et je ne crois pas que l'on puisse faire grang chose pour cela ... comme tout le monde le sait, les snipets étant générés dynamiquement en fonction du mot clé demandé dans la requète ... une page qui aurait 10% de similarité globale sur la page pourrait se retrouver avec 100% de similarité avec un peu de malchance si l'on se limite uniquement à mesurer sur la zone snipet (ce qui est fait me semble t'il sur les pages de résultats) ...

Non je pensais au taux de similarité globale de la page qui fait que lorsque l'on a trop de page similaire à plus n%, elles commencent alors à perdre leurs descriptions voir a être désindexées ... :wink:


Pharaon
Nouveau WRInaute
 
Messages: 19
Inscription: Mar Déc 07, 2004 18:27

Message le Mar Déc 07, 2004 20:13

? quand j analyse mon url a ma pagerank il est marqué erreure via votre outil wri


MagicYoyo
WRInaute accro
WRInaute accro
 
Messages: 2546
Inscription: Lun Mai 24, 2004 15:33

Message le Mer Déc 08, 2004 9:16

WebRankInfo a écrit:mon idée est de demander à mon outil s'il considère que 2 pages sont similaires. Cet outil donnerait un taux de similarité et au-delà d'un certain seuil il décrète les pages similaires.

Tout le problème vient du réglage de l'outil qui pourrait se calquer sur l'un ou l'autre des moteurs. Par exemple si je coche l'option Google, l'outil doit idéalement indiquer la même chose que Google. Problème : comment savoir grâce à Google que 2 pages sont jugées "trop" similaires ? Quand une seule des deux ressort sur une requête, et que pour voir l'autre il faut cliquer sur le lien qui désactive le filtre ? Vos avis m'intéressent...


L'idée me parait géniale, mais je vois une limite à ton raisonement.

Degré de similarité oui, mais sur quels critères ?
- Sur le degré de similarité des codes sources ?
- Sur le degré de similarité du texte visible ? avec ou sans les métas ? avec une pondération alourdissant certains critères ?

Le degré de sensibilité du moteur dépend de la construction de son algorythme d'analyse de la similarité, qui est peut-être complexe...

Est-il envisageable de demander à Google comment ils analysent la similarité de 2 pages ?
Ne serait-ce pas une information bénéfique pour tout le monde ?


mahefarivony
WRInaute accro
WRInaute accro
 
Messages: 11405
Inscription: Lun Oct 14, 2002 10:00

Message le Mer Déc 08, 2004 9:22

juste une petite info : on a tendance a penser que les pages sans titre ni description ne sont pas prises en compte lors des recherches.. Je vous rassure, ce n'est pas (toujours?) le cas .

exemple :
http://www.google.fr/search?q=site:www. ... rt=60&sa=N
vous verrez en 7eme ligne -http://www.madanight.com/viewarticle_46.htm sans titre ni description.. Vous vous dites : c'est fichu pour cette page..

maintenant en allant sur
http://www.google.fr/search?hl=fr&q=Le+ ... scar&meta=
oh miracle, -http://www.madanight.com/viewarticle_46.htm a retrouvé son titre et sa description.. ouf ;-)


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15893
Inscription: Ven Avr 19, 2002 19:51

Message le Mer Déc 08, 2004 10:07

@MagicYoyo : Google ne donnera jamais une telle information. De mon côté, je propose de fournir une note de similarité textuelle + une note de similarité des liens et éventuellement une note qui cumule les deux. Ensuite on verra à quoi ça peut servir ?

aïe, ce que tu montres Mahé ne va pas nous aider à définir ce qu'on veut vraiment avec cet outil de similarité...

Cendrillon, à la rescousse !


Cendrillon
WRInaute accro
WRInaute accro
 
Messages: 4747
Inscription: Mar Aoû 17, 2004 15:41

Message le Mer Déc 08, 2004 10:22

mahefarivony a écrit:maintenant en allant sur
http://www.google.fr/search?hl=fr&q=Le+ ... scar&meta=
oh miracle, -http://www.madanight.com/viewarticle_46.htm a retrouvé son titre et sa description.. ouf

certes, mais il a du puiser sa description dans l'index secondaire (résultat compémentaire, date du cache : 10 avr 2004 20:57:51 GMT.) ce qui veut dire qu'il considère (si j'ai bien compris) ta page sans intérêt ... résultat elle ne sortira que sur ce type de requète (4 mots clés) avec à peine 500 réponses ...
sur cette requète par exemple "diaspora madagascar" tu ne sors déjà plus et elle ne fait "que" 67 500 réponses ...

c'est exactement ce que je cherche à éviter ...


mahefarivony
WRInaute accro
WRInaute accro
 
Messages: 11405
Inscription: Lun Oct 14, 2002 10:00

Message le Mer Déc 08, 2004 10:26

je vais juste faire un petit test si cela ne vous dérange pas ;-)
diaspora madagascar

=> j'ai toujours pensé qu'il ne suffit pas d'avoir un SEUL lien pour qu'une page soit considérée comme non "orpheline".. Voyons voir si j'ai raison ;-)
Dernière édition par mahefarivony le Mer Déc 08, 2004 10:26, édité 1 fois.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15893
Inscription: Ven Avr 19, 2002 19:51

Message le Mer Déc 08, 2004 10:26

es-tu sûre que cela vienne d'une trop grande similarité de cette page avec d'autres du même site ?

ABeDobelU
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 115
Inscription: Mer Sep 08, 2004 8:28

Message le Mer Déc 08, 2004 14:12

Mon site est dynamique et la requete qui sort ma Home (seule page indexée) sort un résultat du meme type (pas de titre ni de texte). j'en parle ici : http://www.webrankinfo.com/forums/viewtopic_19183.htm


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2659
Inscription: Lun Mai 03, 2004 14:48

Message le Mer Déc 08, 2004 15:47

WebRankInfo a écrit:aïe, ce que tu montres Mahé ne va pas nous aider à définir ce qu'on veut vraiment avec cet outil de similarité...

Je ne comprends pas. Je crois que ce que montre Mahé nous indique, au contraire, ce que similarité veut dire pour Google...

Le contenu de la page "article46" est bien pris en compte par Google, mais il n'est pas affiché dans la première recherche parce qu'il est trop proche de celui d'une page affichée. Comme cette page affichée ne contient pas les mots choisis dans la deuxième recherche, la page "article46" n'a plus de concurrent trop similaire et est affichée.

Yes :?:

Jean-Luc


Cendrillon
WRInaute accro
WRInaute accro
 
Messages: 4747
Inscription: Mar Aoû 17, 2004 15:41

Message le Mer Déc 08, 2004 16:00

WebRankInfo a écrit:es-tu sûre que cela vienne d'une trop grande similarité de cette page avec d'autres du même site ?

sûre, non ... convaincue, OUI ... évidement ce ne doit pas être la seule cause possible, mais je suis convaincue que s'en est une ... d'ailleurs nous avons eu de nombreux thread sur le sujet ...
mais je laisse les autres intervenants en témoigner éventuellement ... :wink:


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15893
Inscription: Ven Avr 19, 2002 19:51

Message le Mer Déc 08, 2004 20:10

je pense qu'il ne faut pas se baser sur des requêtes incluant la commande site: car on n'est pas sûr que ça utilise les mêmes critères que dans une requête classique.

ce que je vois avec l'exemple de mahé c'est que sa page est effectivement bien prise en compte par Google, par contre elle est sortie en résultats complémentaire pour l'exemple donné.

je sens qu'il va falloir reprendre des exemples de "désindexations" de pages dynamiques.

squawk
WRInaute accro
WRInaute accro
 
Messages: 5985
Inscription: Lun Mar 22, 2004 19:45

Message le Mer Déc 08, 2004 20:13

Je crois qu'on peut écrire un livre sur ce sujet des pages similaires/désindexées 8) en tous cas bonne chance pour essayer d'y comprendre quelquechose, moi j'y comprends plus rien.. :?

CS76
WRInaute discret
WRInaute discret
 
Messages: 88
Inscription: Lun Oct 20, 2003 21:24

Message le Mer Déc 08, 2004 22:04

Voici un outil permettant de mesurer la similarité de deux pages :

-http://www.webconfs.com/similar-page-checker.php


Madrileño
Madrileño
Madrileño
 
Messages: 19982
Inscription: Mer Juil 07, 2004 12:14

Message le Mer Déc 08, 2004 23:15

C'est normal CS76 que rien ne se charge sauf le Titre ? :lol:

outil de mesure de similarité de 2 pages ... outil de mesure de similarité de 2 pages ...

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités