Taux de similarité entre 2 pages
60 messages
• Page 2 sur 4 • 1, 2, 3, 4
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

Bobez - WRInaute impliqué

- Messages: 716
- Inscription: 20 Mai 2004
parisien94 a écrit:le fait de changer des descriptions, keyword et quelques textes en haut de pages pouvaient faire revenir des pages similaires en pages normales.
Tout à fait, je confirme que ça marche plutôt bien.
Cela montre que Google ne doit certainement pas trancher à un pourcentage donné portant sur l'ensemble de la page (ce que fait "bêtement" l'outil présenté plus haut), mais plutôt que certains éléments (les meta desc/keywords par exemple) ont plus ou moins de poids.
-

Cendrillon - WRInaute accro

- Messages: 4940
- Inscription: 17 Aoû 2004
ben non Bobez, tu confonds aussi similarité des pages et similarité des snipets ...
lorsque tu utilises la commande "site" pour vérifier tes pages et que tu en a 200 en pages ignorées (car trop similaires), ce sont les snipets qui sont similaires, pas les pages ...
alors effectivement dans la mesure ou avec la commande site tu n'a pas de mots clés dans ta requete, il affiche le début du source (donc très souvent de la page) dans les snipets et effectivement dans ce cas, en jouant sur la description et les premiers texte de la page tu vas rendre les snipets suffisament # pour être tous affichés ...
mais cela n'a rien à voir avec la similarité de 2 pages complètes ...
lorsque tu utilises la commande "site" pour vérifier tes pages et que tu en a 200 en pages ignorées (car trop similaires), ce sont les snipets qui sont similaires, pas les pages ...
alors effectivement dans la mesure ou avec la commande site tu n'a pas de mots clés dans ta requete, il affiche le début du source (donc très souvent de la page) dans les snipets et effectivement dans ce cas, en jouant sur la description et les premiers texte de la page tu vas rendre les snipets suffisament # pour être tous affichés ...
mais cela n'a rien à voir avec la similarité de 2 pages complètes ...
-

Bobez - WRInaute impliqué

- Messages: 716
- Inscription: 20 Mai 2004
Effectivement, tu as raison...en fait je n'ai jamais entendu parler de "snipets" ! En fait, on s'y perd avec la similarité, le duplicate content, les snipets...il faudrait que quelqu'un de calé là dessus fasse un point sur tout cela, c'est pas très clair dans ma p'tite tête 
-

Cendrillon - WRInaute accro

- Messages: 4940
- Inscription: 17 Aoû 2004
le snipet c'est la petite description que met google en dessous du titre de la page et qui est construit dynamiquement avec des bouts de phrases où apparaissent les mots clés, pris dans le texte de la page ...
pour chaque requete #, tu auras donc pour une même page un snipet # ...
pour chaque requete #, tu auras donc pour une même page un snipet # ...
- net-annoo
- Nouveau WRInaute

- Messages: 41
- Inscription: 21 Jan 2004
Cendrillon a écrit:le snipet c'est la petite description que met google en dessous du titre de la page et qui est construit dynamiquement avec des bouts de phrases où apparaissent les mots clés, pris dans le texte de la page ...
pour chaque requete #, tu auras donc pour une même page un snipet # ...
bonjour à vous
c'est en effet de ça dont je parlai hier avec la similarité.. j'aurai du préciser.. je n'avai aussi pas remarqué qu'en fait :
"relancer la recherche avec les pages ignorées"
équivaut à juste rajouter &filter=0 ..
merci en tout cas pour cette précision sur le snipet..
a+
-

herveG - Modérateur

- Messages: 9919
- Inscription: 5 Mar 2003
pour faire sortir les pages de la "similitude", il faut donc en plus de changer titre, desc etc. changer le contenu... c est un comble !!
j´aime bien cette idée. je pense que ca évite le deploiement en force de BDD a la fracacao....
Reste a savoir si ce "degré de similutude" est exploité par les moteurs....
Reste a savoir si ce "degré de similutude" est exploité par les moteurs....
-

WebRankInfo - Administrateur du site

- Messages: 18964
- Inscription: 19 Avr 2002
Cendrillon a écrit:mais cela n'a rien à voir avec la similarité de 2 pages complètes ...
au fait as-tu un moyen simple de savoir si d'après Google 2 pages sont similaires ? Ou autrement dit, par quel symptôme tu es sûre à 100% que c'est d'une trop grande similarité qu'il s'agit ?
-

Cendrillon - WRInaute accro

- Messages: 4940
- Inscription: 17 Aoû 2004
à défaut d'autre chose, j'utilise (comme qq uns ici apparememnt) http://www.webconfs.com/similar-page-checker.php , mais le problème c'est que je ne sais pas exactement ce qu'il mesure (ce qu'il prend en compte et comment il en tient compte) ... en fait ce qu'il nous faudrait c'est un bon outil WRI, dont on connaitrait les specs ...
pour moi, le problème de similarité de page a beaucoup joué sur la désindexation de nombre de pages dynamiques (catalogues produits e-commerce) des sites que je suis ... j'ai (nous avons) constaté qu'en dessous de 70% de similarité la désindexation a cessé et les pages ont commencé à être ré-indéxées ...
pour moi, le problème de similarité de page a beaucoup joué sur la désindexation de nombre de pages dynamiques (catalogues produits e-commerce) des sites que je suis ... j'ai (nous avons) constaté qu'en dessous de 70% de similarité la désindexation a cessé et les pages ont commencé à être ré-indéxées ...
-

WebRankInfo - Administrateur du site

- Messages: 18964
- Inscription: 19 Avr 2002
je ne te demandais pas de m'indiquer un outil mais une façon de savoir que Google juge les pages "trop" similaires. ou bien par une description précise des effets...
d'après toi c'est par la désindexation, donc c'est pas vraiment évident surtout pour des tests sur un site qu'on ne connait pas.
d'après toi c'est par la désindexation, donc c'est pas vraiment évident surtout pour des tests sur un site qu'on ne connait pas.
-

Cendrillon - WRInaute accro

- Messages: 4940
- Inscription: 17 Aoû 2004
j'avais pas compris la question ... OUI pour moi le principal effet est la désindexation des pages (perte de la description, voire suppression de la page de l'index) ... 
-

Bobez - WRInaute impliqué

- Messages: 716
- Inscription: 20 Mai 2004
Cendrillon a écrit:à défaut d'autre chose, j'utilise (comme qq uns ici apparememnt) http://www.webconfs.com/similar-page-checker.php , mais le problème c'est que je ne sais pas exactement ce qu'il mesure (ce qu'il prend en compte et comment il en tient compte)
Comme je le disais plus haut, il semble calculer "bêtement" un pourcentage de ressemblance, sans prendre en compte la position dans la page.
Je viens en effet de faire un petit test sur une page de 100octets, en créant une deuxième page dans laquelle j'ai supprimé un caractère dans le <title> par rapport à la première, et une 3e dans laquelle j'ai supprimé un caractère plus bas dans le texte de la page. Résultat avec l'outil: la page 2 a le même pourcentage que la page 3 par rapport à la page 1. Cet outil ne semble donc pas donner un poids différent en fonction de l'emplacement des caractères (balise title, meta, texte de la page, etc).
- net-annoo
- Nouveau WRInaute

- Messages: 41
- Inscription: 21 Jan 2004
Bobez a écrit: Comme je le disais plus haut, il semble calculer "bêtement" un pourcentage de ressemblance, sans prendre en compte la position dans la page.
bjr,
Pas si bêtement" que ça ..
la structure des pages tr td img mais aussi alt etc..
et le deuxieme outils est juste la commande site :
qui te permettra d'optimisé tes snipets.. meta desc etc..
a+
- zeb
- WRInaute accro

- Messages: 3283
- Inscription: 5 Déc 2004
pour info (je ne sais pas si cela peut aider)
j'ai qque pages qui dispose de "snipets" (si je comprend bien, donc, d'un descriptif du contenu de la page situés entre le titre et l'url verte)
en utilisant l'outil presenté ci dessus, celles ci obtiennent un % de ressemblance de 29.936813692412% (cas de deux pages prises au hasard)
style de resultat :
pour deux autres pages, j'obtiens, toujours avec le même outil, 65.640194489465% de similitude.
Ces deux exemples au resultat fort differents, sont basés sur quatres pages disposant de snipets et correctement référencées sur google.
Par contre, dans le cas suivant c'est l'écatombe :
l'outil me renvoie pourtant :
Que penser de tous cela ?
dans un premier temps, j'obtiens un bon referencement a partir de pages fort semblables et d'un autre, c'est l'inverse qui se produit.
Il faux noter que le contenu des pages correctement indexées est un contenu réel, alors que celles qui sont en 'pages similaires', est un enssemble de liens.
Le contenu est il pris en compte dans sa forme (liens, tables, ... le squelete de la pages en somme) ou simplement dans ses mots.
De plus je me suis livré a un autre test (qui mériterait d'être repris de façon rigoureuse si il n'éxiste pas déjà) J'ai pendant un temps décidé de construire dynamiquement les "Meta keywords" de mes pages.
Pour ce faire, j'ai eu recour a un site qui proposait une étude des pages en resortant le pourcentage de mots et groupe de mot de la page. (http://www.outiref.com/)
un exemple :
Par cette technique, je pensais que mes meta serait plus pertinants que jamais dans la mesure ou l'analyse du contenu faite par google ne pouvais que coller avec la realité de ma page.
Les resultats obtenus ne furent pas plus remarcables que ceux sans cette technique.
Ma conclusion est que la similitude 'google' est basée sur plus de critères qu'il n'y parait. Je pense aussi que le fait de passer des parametres dans l'url est un facteur de plus pour atiser la méfiance de Google (il y a même des fois ou je me demande s'il n'ont pas mis un micro espion chez moi (lol ! parano le mec !)).
Voila pour ma petite contribution, je suis toujours a la recherche de parametres formels pouvant donner une règle precise.
PS : parmis mes similaires, je constate un roulement des pages ayant des snipets ... Affaire a suivre
j'ai qque pages qui dispose de "snipets" (si je comprend bien, donc, d'un descriptif du contenu de la page situés entre le titre et l'url verte)
en utilisant l'outil presenté ci dessus, celles ci obtiennent un % de ressemblance de 29.936813692412% (cas de deux pages prises au hasard)
style de resultat :
pour deux autres pages, j'obtiens, toujours avec le même outil, 65.640194489465% de similitude.
Ces deux exemples au resultat fort differents, sont basés sur quatres pages disposant de snipets et correctement référencées sur google.
Par contre, dans le cas suivant c'est l'écatombe :
l'outil me renvoie pourtant :
http://pichot.julien.free.fr/recherche. ... NTGEOFFROY is 22.098873632616% percentage similar to http://pichot.julien.free.fr/recherche. ... +les+ponts
Que penser de tous cela ?
dans un premier temps, j'obtiens un bon referencement a partir de pages fort semblables et d'un autre, c'est l'inverse qui se produit.
Il faux noter que le contenu des pages correctement indexées est un contenu réel, alors que celles qui sont en 'pages similaires', est un enssemble de liens.
Le contenu est il pris en compte dans sa forme (liens, tables, ... le squelete de la pages en somme) ou simplement dans ses mots.
De plus je me suis livré a un autre test (qui mériterait d'être repris de façon rigoureuse si il n'éxiste pas déjà) J'ai pendant un temps décidé de construire dynamiquement les "Meta keywords" de mes pages.
Pour ce faire, j'ai eu recour a un site qui proposait une étude des pages en resortant le pourcentage de mots et groupe de mot de la page. (http://www.outiref.com/)
un exemple :
Par cette technique, je pensais que mes meta serait plus pertinants que jamais dans la mesure ou l'analyse du contenu faite par google ne pouvais que coller avec la realité de ma page.
Les resultats obtenus ne furent pas plus remarcables que ceux sans cette technique.
Ma conclusion est que la similitude 'google' est basée sur plus de critères qu'il n'y parait. Je pense aussi que le fait de passer des parametres dans l'url est un facteur de plus pour atiser la méfiance de Google (il y a même des fois ou je me demande s'il n'ont pas mis un micro espion chez moi (lol ! parano le mec !)).
Voila pour ma petite contribution, je suis toujours a la recherche de parametres formels pouvant donner une règle precise.
PS : parmis mes similaires, je constate un roulement des pages ayant des snipets ... Affaire a suivre
60 messages
• Page 2 sur 4 • 1, 2, 3, 4
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Similarité de pages
- Taux de rebond et taux de sortie
- outil de similarité défectueux ?
- Taux de rebond VS Taux de sortie
- Similarité de 2 pages ? Blacklistage ?
- Outil - Similarité - Densité
- Recherche d'images par similarité
- Annuaire musical par similarité
- Calcul de similarité entre 2 pages
- outil de mesure de similarité de 2 pages ...
- Calcul du taux de liens vers des pages internes
Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés. - Détection de pages similaires
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité


