Taux de similarité entre 2 pages

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


Bobez
WRInaute passionné
WRInaute passionné
 
Messages: 716
Inscription: Jeu Mai 20, 2004 13:03

Message le Jeu Jan 20, 2005 14:14

parisien94 a écrit:le fait de changer des descriptions, keyword et quelques textes en haut de pages pouvaient faire revenir des pages similaires en pages normales.

Tout à fait, je confirme que ça marche plutôt bien.
Cela montre que Google ne doit certainement pas trancher à un pourcentage donné portant sur l'ensemble de la page (ce que fait "bêtement" l'outil présenté plus haut), mais plutôt que certains éléments (les meta desc/keywords par exemple) ont plus ou moins de poids.


Cendrillon
WRInaute accro
WRInaute accro
 
Messages: 4747
Inscription: Mar Aoû 17, 2004 15:41

Message le Jeu Jan 20, 2005 14:35

ben non Bobez, tu confonds aussi similarité des pages et similarité des snipets ...

lorsque tu utilises la commande "site" pour vérifier tes pages et que tu en a 200 en pages ignorées (car trop similaires), ce sont les snipets qui sont similaires, pas les pages ...

alors effectivement dans la mesure ou avec la commande site tu n'a pas de mots clés dans ta requete, il affiche le début du source (donc très souvent de la page) dans les snipets et effectivement dans ce cas, en jouant sur la description et les premiers texte de la page tu vas rendre les snipets suffisament # pour être tous affichés ...

mais cela n'a rien à voir avec la similarité de 2 pages complètes ... :wink:


Bobez
WRInaute passionné
WRInaute passionné
 
Messages: 716
Inscription: Jeu Mai 20, 2004 13:03

Message le Jeu Jan 20, 2005 14:42

Effectivement, tu as raison...en fait je n'ai jamais entendu parler de "snipets" ! En fait, on s'y perd avec la similarité, le duplicate content, les snipets...il faudrait que quelqu'un de calé là dessus fasse un point sur tout cela, c'est pas très clair dans ma p'tite tête :)


Cendrillon
WRInaute accro
WRInaute accro
 
Messages: 4747
Inscription: Mar Aoû 17, 2004 15:41

Message le Jeu Jan 20, 2005 14:51

le snipet c'est la petite description que met google en dessous du titre de la page et qui est construit dynamiquement avec des bouts de phrases où apparaissent les mots clés, pris dans le texte de la page ...

pour chaque requete #, tu auras donc pour une même page un snipet # ... :wink:

net-annoo
Nouveau WRInaute
 
Messages: 41
Inscription: Mer Jan 21, 2004 20:31

Message le Jeu Jan 20, 2005 15:27

Cendrillon a écrit:le snipet c'est la petite description que met google en dessous du titre de la page et qui est construit dynamiquement avec des bouts de phrases où apparaissent les mots clés, pris dans le texte de la page ...
pour chaque requete #, tu auras donc pour une même page un snipet # ... :wink:


bonjour à vous

c'est en effet de ça dont je parlai hier avec la similarité.. j'aurai du préciser.. je n'avai aussi pas remarqué qu'en fait :
"relancer la recherche avec les pages ignorées"
équivaut à juste rajouter &filter=0 ..
merci en tout cas pour cette précision sur le snipet..
a+


herveG
Modérateur
Modérateur
 
Messages: 9843
Inscription: Mer Mar 05, 2003 11:33

Message le Jeu Jan 20, 2005 15:36

pour faire sortir les pages de la "similitude", il faut donc en plus de changer titre, desc etc. changer le contenu... c est un comble !! :) j´aime bien cette idée. je pense que ca évite le deploiement en force de BDD a la fracacao....
Reste a savoir si ce "degré de similutude" est exploité par les moteurs....


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15902
Inscription: Ven Avr 19, 2002 19:51

Message le Jeu Jan 20, 2005 16:28

Cendrillon a écrit:mais cela n'a rien à voir avec la similarité de 2 pages complètes ... :wink:

au fait as-tu un moyen simple de savoir si d'après Google 2 pages sont similaires ? Ou autrement dit, par quel symptôme tu es sûre à 100% que c'est d'une trop grande similarité qu'il s'agit ?


Cendrillon
WRInaute accro
WRInaute accro
 
Messages: 4747
Inscription: Mar Aoû 17, 2004 15:41

Message le Jeu Jan 20, 2005 16:44

à défaut d'autre chose, j'utilise (comme qq uns ici apparememnt) http://www.webconfs.com/similar-page-checker.php , mais le problème c'est que je ne sais pas exactement ce qu'il mesure (ce qu'il prend en compte et comment il en tient compte) ... en fait ce qu'il nous faudrait c'est un bon outil WRI, dont on connaitrait les specs ... :P

pour moi, le problème de similarité de page a beaucoup joué sur la désindexation de nombre de pages dynamiques (catalogues produits e-commerce) des sites que je suis ... j'ai (nous avons) constaté qu'en dessous de 70% de similarité la désindexation a cessé et les pages ont commencé à être ré-indéxées ... :wink:


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15902
Inscription: Ven Avr 19, 2002 19:51

Message le Jeu Jan 20, 2005 16:47

je ne te demandais pas de m'indiquer un outil mais une façon de savoir que Google juge les pages "trop" similaires. ou bien par une description précise des effets...

d'après toi c'est par la désindexation, donc c'est pas vraiment évident surtout pour des tests sur un site qu'on ne connait pas.


Cendrillon
WRInaute accro
WRInaute accro
 
Messages: 4747
Inscription: Mar Aoû 17, 2004 15:41

Message le Jeu Jan 20, 2005 16:51

j'avais pas compris la question ... OUI pour moi le principal effet est la désindexation des pages (perte de la description, voire suppression de la page de l'index) ... :wink:


snakeface
WRInaute impliqué
WRInaute impliqué
 
Messages: 296
Inscription: Jeu Oct 09, 2003 14:25

Message le Jeu Jan 20, 2005 16:53

Attention cendrillon tu risque de PERDRE des positions !


Cendrillon
WRInaute accro
WRInaute accro
 
Messages: 4747
Inscription: Mar Aoû 17, 2004 15:41

Message le Jeu Jan 20, 2005 17:05

pourquoi dis tu ça ? 8O


Bobez
WRInaute passionné
WRInaute passionné
 
Messages: 716
Inscription: Jeu Mai 20, 2004 13:03

Message le Jeu Jan 20, 2005 17:22

Cendrillon a écrit:à défaut d'autre chose, j'utilise (comme qq uns ici apparememnt) http://www.webconfs.com/similar-page-checker.php , mais le problème c'est que je ne sais pas exactement ce qu'il mesure (ce qu'il prend en compte et comment il en tient compte)

Comme je le disais plus haut, il semble calculer "bêtement" un pourcentage de ressemblance, sans prendre en compte la position dans la page.
Je viens en effet de faire un petit test sur une page de 100octets, en créant une deuxième page dans laquelle j'ai supprimé un caractère dans le <title> par rapport à la première, et une 3e dans laquelle j'ai supprimé un caractère plus bas dans le texte de la page. Résultat avec l'outil: la page 2 a le même pourcentage que la page 3 par rapport à la page 1. Cet outil ne semble donc pas donner un poids différent en fonction de l'emplacement des caractères (balise title, meta, texte de la page, etc).

net-annoo
Nouveau WRInaute
 
Messages: 41
Inscription: Mer Jan 21, 2004 20:31

Message le Jeu Jan 20, 2005 18:12

Bobez a écrit: Comme je le disais plus haut, il semble calculer "bêtement" un pourcentage de ressemblance, sans prendre en compte la position dans la page.


bjr,
Pas si bêtement" que ça .. :) il te permet d'optimisé la similarité (graphique)
la structure des pages tr td img mais aussi alt etc..
et le deuxieme outils est juste la commande site :
qui te permettra d'optimisé tes snipets.. meta desc etc..
a+ :)


zeb
WRInaute accro
WRInaute accro
 
Messages: 1186
Inscription: Dim Déc 05, 2004 19:47

Message le Sam Fév 12, 2005 17:48

pour info (je ne sais pas si cela peut aider)

j'ai qque pages qui dispose de "snipets" (si je comprend bien, donc, d'un descriptif du contenu de la page situés entre le titre et l'url verte)

en utilisant l'outil presenté ci dessus, celles ci obtiennent un % de ressemblance de 29.936813692412% (cas de deux pages prises au hasard)

style de resultat :

Image

pour deux autres pages, j'obtiens, toujours avec le même outil, 65.640194489465% de similitude.

Ces deux exemples au resultat fort differents, sont basés sur quatres pages disposant de snipets et correctement référencées sur google.

Par contre, dans le cas suivant c'est l'écatombe :

Image

l'outil me renvoie pourtant :



Que penser de tous cela ?

dans un premier temps, j'obtiens un bon referencement a partir de pages fort semblables et d'un autre, c'est l'inverse qui se produit.

Il faux noter que le contenu des pages correctement indexées est un contenu réel, alors que celles qui sont en 'pages similaires', est un enssemble de liens.

Le contenu est il pris en compte dans sa forme (liens, tables, ... le squelete de la pages en somme) ou simplement dans ses mots.

De plus je me suis livré a un autre test (qui mériterait d'être repris de façon rigoureuse si il n'éxiste pas déjà) J'ai pendant un temps décidé de construire dynamiquement les "Meta keywords" de mes pages.
Pour ce faire, j'ai eu recour a un site qui proposait une étude des pages en resortant le pourcentage de mots et groupe de mot de la page. (http://www.outiref.com/)

un exemple :

Image

Par cette technique, je pensais que mes meta serait plus pertinants que jamais dans la mesure ou l'analyse du contenu faite par google ne pouvais que coller avec la realité de ma page.

Les resultats obtenus ne furent pas plus remarcables que ceux sans cette technique.

Ma conclusion est que la similitude 'google' est basée sur plus de critères qu'il n'y parait. Je pense aussi que le fait de passer des parametres dans l'url est un facteur de plus pour atiser la méfiance de Google (il y a même des fois ou je me demande s'il n'ont pas mis un micro espion chez moi (lol ! parano le mec !)).

Voila pour ma petite contribution, je suis toujours a la recherche de parametres formels pouvant donner une règle precise.

PS : parmis mes similaires, je constate un roulement des pages ayant des snipets ... Affaire a suivre :wink:

Taux de similarité entre 2 pages Taux de similarité entre 2 pages

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Calcul du taux de liens vers des pages internes
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités