Taux de similarité entre 2 pages
43 messages • Page 2 sur 3 • 1, 2, 3
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
parisien94 a écrit:le fait de changer des descriptions, keyword et quelques textes en haut de pages pouvaient faire revenir des pages similaires en pages normales.
Tout à fait, je confirme que ça marche plutôt bien.
Cela montre que Google ne doit certainement pas trancher à un pourcentage donné portant sur l'ensemble de la page (ce que fait "bêtement" l'outil présenté plus haut), mais plutôt que certains éléments (les meta desc/keywords par exemple) ont plus ou moins de poids.
-

Cendrillon - WRInaute accro

- Messages: 4747
- Inscription: Mar Aoû 17, 2004 15:41
ben non Bobez, tu confonds aussi similarité des pages et similarité des snipets ...
lorsque tu utilises la commande "site" pour vérifier tes pages et que tu en a 200 en pages ignorées (car trop similaires), ce sont les snipets qui sont similaires, pas les pages ...
alors effectivement dans la mesure ou avec la commande site tu n'a pas de mots clés dans ta requete, il affiche le début du source (donc très souvent de la page) dans les snipets et effectivement dans ce cas, en jouant sur la description et les premiers texte de la page tu vas rendre les snipets suffisament # pour être tous affichés ...
mais cela n'a rien à voir avec la similarité de 2 pages complètes ...
lorsque tu utilises la commande "site" pour vérifier tes pages et que tu en a 200 en pages ignorées (car trop similaires), ce sont les snipets qui sont similaires, pas les pages ...
alors effectivement dans la mesure ou avec la commande site tu n'a pas de mots clés dans ta requete, il affiche le début du source (donc très souvent de la page) dans les snipets et effectivement dans ce cas, en jouant sur la description et les premiers texte de la page tu vas rendre les snipets suffisament # pour être tous affichés ...
mais cela n'a rien à voir avec la similarité de 2 pages complètes ...
Effectivement, tu as raison...en fait je n'ai jamais entendu parler de "snipets" ! En fait, on s'y perd avec la similarité, le duplicate content, les snipets...il faudrait que quelqu'un de calé là dessus fasse un point sur tout cela, c'est pas très clair dans ma p'tite tête 
-

Cendrillon - WRInaute accro

- Messages: 4747
- Inscription: Mar Aoû 17, 2004 15:41
le snipet c'est la petite description que met google en dessous du titre de la page et qui est construit dynamiquement avec des bouts de phrases où apparaissent les mots clés, pris dans le texte de la page ...
pour chaque requete #, tu auras donc pour une même page un snipet # ...
pour chaque requete #, tu auras donc pour une même page un snipet # ...
Cendrillon a écrit:le snipet c'est la petite description que met google en dessous du titre de la page et qui est construit dynamiquement avec des bouts de phrases où apparaissent les mots clés, pris dans le texte de la page ...
pour chaque requete #, tu auras donc pour une même page un snipet # ...
bonjour à vous
c'est en effet de ça dont je parlai hier avec la similarité.. j'aurai du préciser.. je n'avai aussi pas remarqué qu'en fait :
"relancer la recherche avec les pages ignorées"
équivaut à juste rajouter &filter=0 ..
merci en tout cas pour cette précision sur le snipet..
a+
pour faire sortir les pages de la "similitude", il faut donc en plus de changer titre, desc etc. changer le contenu... c est un comble !!
j´aime bien cette idée. je pense que ca évite le deploiement en force de BDD a la fracacao....
Reste a savoir si ce "degré de similutude" est exploité par les moteurs....
Reste a savoir si ce "degré de similutude" est exploité par les moteurs....
-

WebRankInfo - Administrateur du site

- Messages: 15902
- Inscription: Ven Avr 19, 2002 19:51
Cendrillon a écrit:mais cela n'a rien à voir avec la similarité de 2 pages complètes ...
au fait as-tu un moyen simple de savoir si d'après Google 2 pages sont similaires ? Ou autrement dit, par quel symptôme tu es sûre à 100% que c'est d'une trop grande similarité qu'il s'agit ?
-

Cendrillon - WRInaute accro

- Messages: 4747
- Inscription: Mar Aoû 17, 2004 15:41
à défaut d'autre chose, j'utilise (comme qq uns ici apparememnt) http://www.webconfs.com/similar-page-checker.php , mais le problème c'est que je ne sais pas exactement ce qu'il mesure (ce qu'il prend en compte et comment il en tient compte) ... en fait ce qu'il nous faudrait c'est un bon outil WRI, dont on connaitrait les specs ...
pour moi, le problème de similarité de page a beaucoup joué sur la désindexation de nombre de pages dynamiques (catalogues produits e-commerce) des sites que je suis ... j'ai (nous avons) constaté qu'en dessous de 70% de similarité la désindexation a cessé et les pages ont commencé à être ré-indéxées ...
pour moi, le problème de similarité de page a beaucoup joué sur la désindexation de nombre de pages dynamiques (catalogues produits e-commerce) des sites que je suis ... j'ai (nous avons) constaté qu'en dessous de 70% de similarité la désindexation a cessé et les pages ont commencé à être ré-indéxées ...
-

WebRankInfo - Administrateur du site

- Messages: 15902
- Inscription: Ven Avr 19, 2002 19:51
je ne te demandais pas de m'indiquer un outil mais une façon de savoir que Google juge les pages "trop" similaires. ou bien par une description précise des effets...
d'après toi c'est par la désindexation, donc c'est pas vraiment évident surtout pour des tests sur un site qu'on ne connait pas.
d'après toi c'est par la désindexation, donc c'est pas vraiment évident surtout pour des tests sur un site qu'on ne connait pas.
-

Cendrillon - WRInaute accro

- Messages: 4747
- Inscription: Mar Aoû 17, 2004 15:41
j'avais pas compris la question ... OUI pour moi le principal effet est la désindexation des pages (perte de la description, voire suppression de la page de l'index) ... 
Cendrillon a écrit:à défaut d'autre chose, j'utilise (comme qq uns ici apparememnt) http://www.webconfs.com/similar-page-checker.php , mais le problème c'est que je ne sais pas exactement ce qu'il mesure (ce qu'il prend en compte et comment il en tient compte)
Comme je le disais plus haut, il semble calculer "bêtement" un pourcentage de ressemblance, sans prendre en compte la position dans la page.
Je viens en effet de faire un petit test sur une page de 100octets, en créant une deuxième page dans laquelle j'ai supprimé un caractère dans le <title> par rapport à la première, et une 3e dans laquelle j'ai supprimé un caractère plus bas dans le texte de la page. Résultat avec l'outil: la page 2 a le même pourcentage que la page 3 par rapport à la page 1. Cet outil ne semble donc pas donner un poids différent en fonction de l'emplacement des caractères (balise title, meta, texte de la page, etc).
Bobez a écrit: Comme je le disais plus haut, il semble calculer "bêtement" un pourcentage de ressemblance, sans prendre en compte la position dans la page.
bjr,
Pas si bêtement" que ça ..
la structure des pages tr td img mais aussi alt etc..
et le deuxieme outils est juste la commande site :
qui te permettra d'optimisé tes snipets.. meta desc etc..
a+
pour info (je ne sais pas si cela peut aider)
j'ai qque pages qui dispose de "snipets" (si je comprend bien, donc, d'un descriptif du contenu de la page situés entre le titre et l'url verte)
en utilisant l'outil presenté ci dessus, celles ci obtiennent un % de ressemblance de 29.936813692412% (cas de deux pages prises au hasard)
style de resultat :
pour deux autres pages, j'obtiens, toujours avec le même outil, 65.640194489465% de similitude.
Ces deux exemples au resultat fort differents, sont basés sur quatres pages disposant de snipets et correctement référencées sur google.
Par contre, dans le cas suivant c'est l'écatombe :
l'outil me renvoie pourtant :
Que penser de tous cela ?
dans un premier temps, j'obtiens un bon referencement a partir de pages fort semblables et d'un autre, c'est l'inverse qui se produit.
Il faux noter que le contenu des pages correctement indexées est un contenu réel, alors que celles qui sont en 'pages similaires', est un enssemble de liens.
Le contenu est il pris en compte dans sa forme (liens, tables, ... le squelete de la pages en somme) ou simplement dans ses mots.
De plus je me suis livré a un autre test (qui mériterait d'être repris de façon rigoureuse si il n'éxiste pas déjà) J'ai pendant un temps décidé de construire dynamiquement les "Meta keywords" de mes pages.
Pour ce faire, j'ai eu recour a un site qui proposait une étude des pages en resortant le pourcentage de mots et groupe de mot de la page. (http://www.outiref.com/)
un exemple :
Par cette technique, je pensais que mes meta serait plus pertinants que jamais dans la mesure ou l'analyse du contenu faite par google ne pouvais que coller avec la realité de ma page.
Les resultats obtenus ne furent pas plus remarcables que ceux sans cette technique.
Ma conclusion est que la similitude 'google' est basée sur plus de critères qu'il n'y parait. Je pense aussi que le fait de passer des parametres dans l'url est un facteur de plus pour atiser la méfiance de Google (il y a même des fois ou je me demande s'il n'ont pas mis un micro espion chez moi (lol ! parano le mec !)).
Voila pour ma petite contribution, je suis toujours a la recherche de parametres formels pouvant donner une règle precise.
PS : parmis mes similaires, je constate un roulement des pages ayant des snipets ... Affaire a suivre
j'ai qque pages qui dispose de "snipets" (si je comprend bien, donc, d'un descriptif du contenu de la page situés entre le titre et l'url verte)
en utilisant l'outil presenté ci dessus, celles ci obtiennent un % de ressemblance de 29.936813692412% (cas de deux pages prises au hasard)
style de resultat :
pour deux autres pages, j'obtiens, toujours avec le même outil, 65.640194489465% de similitude.
Ces deux exemples au resultat fort differents, sont basés sur quatres pages disposant de snipets et correctement référencées sur google.
Par contre, dans le cas suivant c'est l'écatombe :
l'outil me renvoie pourtant :
http://pichot.julien.free.fr/recherche. ... NTGEOFFROY is 22.098873632616% percentage similar to http://pichot.julien.free.fr/recherche. ... +les+ponts
Que penser de tous cela ?
dans un premier temps, j'obtiens un bon referencement a partir de pages fort semblables et d'un autre, c'est l'inverse qui se produit.
Il faux noter que le contenu des pages correctement indexées est un contenu réel, alors que celles qui sont en 'pages similaires', est un enssemble de liens.
Le contenu est il pris en compte dans sa forme (liens, tables, ... le squelete de la pages en somme) ou simplement dans ses mots.
De plus je me suis livré a un autre test (qui mériterait d'être repris de façon rigoureuse si il n'éxiste pas déjà) J'ai pendant un temps décidé de construire dynamiquement les "Meta keywords" de mes pages.
Pour ce faire, j'ai eu recour a un site qui proposait une étude des pages en resortant le pourcentage de mots et groupe de mot de la page. (http://www.outiref.com/)
un exemple :
Par cette technique, je pensais que mes meta serait plus pertinants que jamais dans la mesure ou l'analyse du contenu faite par google ne pouvais que coller avec la realité de ma page.
Les resultats obtenus ne furent pas plus remarcables que ceux sans cette technique.
Ma conclusion est que la similitude 'google' est basée sur plus de critères qu'il n'y parait. Je pense aussi que le fait de passer des parametres dans l'url est un facteur de plus pour atiser la méfiance de Google (il y a même des fois ou je me demande s'il n'ont pas mis un micro espion chez moi (lol ! parano le mec !)).
Voila pour ma petite contribution, je suis toujours a la recherche de parametres formels pouvant donner une règle precise.
PS : parmis mes similaires, je constate un roulement des pages ayant des snipets ... Affaire a suivre
43 messages • Page 2 sur 3 • 1, 2, 3
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Analyse de pages similaires
- Calcul du ratio de liens profonds vers un site web
- Annonces illustrées Google Adsense
- Brevet de Google sur le contenu dupliqué
- Outil de suggestion de mots sémantiquement proches
- AdSense : des AdWords sur vos sites
- Les annonces illustrées de Google AdSense
- Améliorer le taux de conversion : la clé de la réussite !
- Comment l'internaute utilise les moteurs de recherche
- Brevet de Microsoft sur l'analyse des textes de backlinks
- Similarité de 2 pages ? Blacklistage ?
- Outil - Similarité - Densité
- Annuaire musical par similarité
- Calcul de similarité entre 2 pages
- outil de mesure de similarité de 2 pages ...
- Similarité de contenu et bug commande site:
- Similarité entre 2 sites > résultats complémentaires
- Eviter le duplicate content (similarité du contenu)
- danger similarite entre les urls
- Similarité des pages : je vais m'évanouir !!!!!
- Peur sur la similarité entre mes pages
- [Demande Technique] Similarité entre ces 2 textes : 94% !!!
- Algorithme de similarité entre deux pages(Duplicate Content)
- [Outil] Calcul de similarité textuelle entre 2 pages web
- différents résultats sur différents outil de similarite
- Calcul du taux de liens vers des pages internes
Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités







le forum