Messages: 22759

Enregistré le: 19 Avr 2002

Message le Ven Oct 22, 2004 17:24

Vous avez déjà dû remarquer que parfois dans les résultats de Google certains sites ont le privilège de sortir avec deux pages (clustering). Cet article nous explique comment cela arrive et surtout ce qu'il faut faire pour optimiser son site en fonction de ceci...

l'actu : http://www.webrankinfo.com/actualites/2 ... ultats.htm
l'article : http://www.webrankinfo.com/analyses/aut ... oubles.php
Haut
74 Réponses
Messages: 959

Enregistré le: 11 Mar 2003

Message le Ven Oct 22, 2004 17:39

Vraiment géniale.
Je ne savais vraiment pas comment il falait si prendre pour avoir (le clustering)
Haut
Messages: 22759

Enregistré le: 19 Avr 2002

Message le Ven Oct 22, 2004 17:44

Mon 1er commentaire : il suffit d'utiliser l'API pour se rendre compte de ce phénomène (en tout cas je l'avais déjà remarqué en observant les résultats de l'API), car il n'y a pas de regroupement comme ça avec l'API (ou alors on peut le désactiver, je ne sais plus).

En tout cas c'est une idée vraiment intéressante à creuser je pense !!!
Haut
Messages: 155

Enregistré le: 31 Oct 2003

Message le Ven Oct 22, 2004 17:48

Je comprends maintenant pourquoi quand on demande les résultats avec une page de 100 résultats (recherche avancée) les pages des sites sont regroupées 2 par 2
Haut
Messages: 943

Enregistré le: 28 Juil 2004

Message le Ven Oct 22, 2004 18:01

Très bon article... comme toujours ;)
Maintenant l'optimisation est sans doute interessante pour un petit nombre de requetes... je pense qu'il vaut mieux optimiser classiquement, sans se soucier du dual-result et si on se retrouve regroupé c'est qu'on est bien référencé, qu'on a bien travaillé...
Haut
Messages: 289

Enregistré le: 22 Mar 2004

Message le Ven Oct 22, 2004 18:14

Sur toutes les recherches un sous domaine ne peut être représenté que 2 fois.
ça peut poser un pb si plusieurs sites sont hébergés dans des répertoires et non des sous domaines et veulent se placer sur le même mot clé.
Je n'étais pas concerné mais les sites perso.wanadoo étaient pénalisés sur cette requete

alors qu'il y en avait beaucoup

Je trouve qu'il est tres difficile de placer 2 pages dans le top10 sur une requete concurrentielle... les mots pour lesquels j'y suis arrivé me donnent une dizaine de visites par jour pas plus.
Haut
Messages: 5288

Enregistré le: 18 Fév 2004

Message le Ven Oct 22, 2004 19:44

Ba moi ça m'arrivait sur certaines requetes mais j'ai jamais fais gaffe à ça :-) Mais tant mieux :-)
Haut
Messages: 5963

Enregistré le: 22 Mar 2004

Message le Ven Oct 22, 2004 19:59

Super article :) , c'est dingue j'avais jamais remarqué que quand il y a plusieurs résultats pour le meme domaine le deuxième résultat était décalé...

Sinon j'ai une super astuce pour apparaitre dans 3 résultats, se faire "piquer" ses pages par un annuaire qui fait des redirections sauvages.... :roll:

http://www.google.fr/search?hl=fr&c2cof ... s+pc&meta=
Haut
Messages: 474

Enregistré le: 27 Fév 2004

Message le Ven Oct 22, 2004 20:13

Très intéressant! Il est clair que le double affichage est bien plus mis en valeur que les résultats standards! Mais à mon avis, un site bien structuré et, dans l'ensemble, bien référencé devrait se voir afficher tout seul des résultats comme celui-ci... Maintenant, je ne suis pas expert en réferencement, mais ca me semble tout de même assez logique, non?
Quant à l'astuce ci-dessus qui consiste à se faire voler une page par une redirection, je reste sceptique... A moins d'être vraiment sûr de son coup, c'est du quitte ou double. Souvent, ces annuaire volent la première place. A partir de là, qu'est ce qui empecherait un jour à ces sites de vouloir utiliser toutes ses pages bien positionnées pour son compte personnel?
Haut
Messages: 878

Enregistré le: 1 Aoû 2004

Message le Ven Oct 22, 2004 20:57

J'avais déjà remarqué ca précédemment.
J'en saurai plus maintenant.

Sinon j'ai remarqué une petite faute de grammaire:
Alors comment faire pour augmenter ses chances d'y parvenir ?

:wink:
Haut
Messages: 7

Enregistré le: 22 Oct 2004

Message le Ven Oct 22, 2004 21:38

Bonjour à tous,

Je suis ravi que cet article vous plaise :wink:

Moffen a écrit:Je comprends maintenant pourquoi quand on demande les résultats avec une page de 100 résultats (recherche avancée) les pages des sites sont regroupées 2 par 2


Effectivement c'était un bon moyen pour repérer ce "phénomène".

totoro a écrit:Très bon article... comme toujours :wink:


Ce n'est que mon premier mais j'en rédigerais d'autres si vous les trouvez intéressants :D

squawk a écrit:Sinon j'ai une super astuce pour apparaitre dans 3 résultats, se faire "piquer" ses pages par un annuaire qui fait des redirections sauvages


Je pense que Google va bientôt corriger ce "bug" :lol:
Haut
Messages: 262

Enregistré le: 4 Oct 2004

Message le Ven Oct 22, 2004 21:41

Par exemple, sur la requête « assurance habitation » deux assureurs ont ce privilège. Groupama classé #4 et #5 et la Macif classée #7 et #8.


Sur Google je ne vois qu'Assurland et Groupama. Seul petit défaut de GG, il met ses pages plus à jour que nous lol.

Merci quand même pour l'article, je vais le lire puisque ça m'interesse...
Haut
Messages: 262

Enregistré le: 4 Oct 2004

Message le Ven Oct 22, 2004 21:47

Alexis-Berger,

Merci pour l'article, en effet il est très interessant mais surtout bien étudier !

Un petit mot à rajouter tout de même... Pour les hébergeur perso, il suffit qu'il y ai 2 sites qui parle de la même chose que vous antérieur en date au votre dans l'index gg et vous voilà à tout jamais radié des recherches. En effet, le dédoublement existe pour les extension de site, mais pas le triplement !
Haut
Messages: 7

Enregistré le: 22 Oct 2004

Message le Ven Oct 22, 2004 22:01

Jeromeb a écrit:Sur Google je ne vois qu'Assurland et Groupama. Seul petit défaut de GG, il met ses pages plus à jour que nous lol.


Effectivement, l'index a déjà été modifié :?
Mais il est facile de reproduire mon schéma sur d'autres requêtes puisque le principe est toujours le même :wink:
Haut
Messages: 826

Enregistré le: 25 Jan 2003

Message le Ven Oct 22, 2004 22:58

Bonsoir à tous...

Je suis vraiment navré de casser l'ambiance de ce post mais là, je ne pouvais pas laisser passer...

L'exemple d'Olivier (Wri) est vraiment mal choisi... Le top five de Google sur "assurance habitation" ne retourne que des tricheurs...
Désactivez Java Script ou regardez simplement la taille des pages pour vous convaincre que ces sociétés sont "blacklistables" par Google et n'ont rien à faire dans la première page du SERP.

Je connais bien le secteur de l'Assurance puisque je travaille pour l'une des plus importantes (celle qui assure... d'après C. et L.) et j'essaie tous les jours de me battre (le terme n'est pas trop fort) pour être "juste derrière" ces enfoirés qui utilisent ces techniques... Essayez donc "assurance auto" pour voir !

Bref, sur un exemple très mal choisi, ne nous laissons pas impressionner par un quelconque classement dans Google !

Kendos
Haut
Messages: 134

Enregistré le: 11 Juil 2004

Message le Sam Oct 23, 2004 0:47

kendos a écrit:Bonsoir à tous...

Je suis vraiment navré de casser l'ambiance de ce post mais là, je ne pouvais pas laisser passer...

L'exemple d'Olivier (Wri) est vraiment mal choisi...


A mon humble avis, l'exemple etait juste choisi pour montrer le phenomene du clustering sur google

Apres que sa tombe sur ton secteur et qu'il y ai plein de gus au dessus de toi dans les resultats, c'est une toute autre affaire...qui n'a aucun rapport avec le clustering.
Haut
Messages: 826

Enregistré le: 25 Jan 2003

Message le Sam Oct 23, 2004 0:56

Que tu crois... Qui ne sais pas..

Effectivement, il n'y a qu'Olivier et moi qui puissent comprendre le sens du SERP !?
M'enfin ! Vous n'êtes pas des boeufs ! Regardez les réponses...

Kendos

PS : Looping, t'as au moins pigé chez qui je bosse ? :D
Haut
Messages: 201

Enregistré le: 12 Déc 2003

Message le Sam Oct 23, 2004 6:47

Oué c ‘est super !

Si tout le monde arrive a faire ce type d'optimisation , il y aura 5 sites par pages de google

On est des millions a vouloir etre sur la premiere page c'est déja dur en fonction des mots clés , vous trouver pas ca con de diminuer de 50% nos chance ? (dans le cas ou ce type d'optimisation ce dévelloper énormement)

Et c’est quoi l’interet pour l’internaute d’arriver 2 fois sur le meme site ?

Personnelement je trouve ca vraiment nul

Pourquoi pas essayer de sortir sur toute la premiere page aussi.
Haut
Messages: 7

Enregistré le: 22 Oct 2004

Message le Sam Oct 23, 2004 10:46

kendos a écrit:L'exemple d'Olivier (Wri) est vraiment mal choisi... Le top five de Google sur "assurance habitation" ne retourne que des tricheurs...
Bref, sur un exemple très mal choisi, ne nous laissons pas impressionner par un quelconque classement dans Google !


Etant l'auteur de l'article c'est moi qui ai choisi l'exemple et non Olivier...
Je décris le fonctionnement de Google au sujet du clustering.
Donc je ne vois aucun rapport avec votre remarque.
Je parle du fond et vous me parlez de la forme et ce que je met un avant tout le long de l'article c'est le fond car c'est lui qui est interessant.
D'ailleurs ensuite je parle de voitures Renault sans avoir effectué de recherche sur Google avec ces termes car cela n'a strictement aucune importance.
Les exemples ne servent qu'à aider à la compréhension du clustering donc de l'article.
Haut
Messages: 7

Enregistré le: 22 Oct 2004

Message le Sam Oct 23, 2004 10:54

FlashPower a écrit:Oué c ‘est super !

Si tout le monde arrive a faire ce type d'optimisation , il y aura 5 sites par pages de google

Et c’est quoi l’interet pour l’internaute d’arriver 2 fois sur le meme site ?

Personnelement je trouve ca vraiment nul


Sans vouloir vous offenser je me demande ce que vous faite sur WebRankInfo :?:
Puisque vous semblez refuser toute optimisation de site...
Concernant votre remarque "Et c’est quoi l’interet pour l’internaute d’arriver 2 fois sur le meme site ?" Je vous conseille de vous plaindre directement à Google puisque c'est eux qui ont choisi ce système et non moi (d'ailleurs si Google veut m'embaucher j'étudirais toute proposition, la mobilité géographique n'est pas un problème :wink: )
Comme pour kendos vous critiquez mon article sur la forme (alors que je n'ai pas de contrôle dessus puisque les doubles listes ont été créées par Google et que s'il existe des spammeurs sur Google ce n'est pas non plus de ma faute) et non sur le fond.
Haut
Messages: 22759

Enregistré le: 19 Avr 2002

Message le Sam Oct 23, 2004 10:58

Effectivement...

Pour éviter toute dérive vers des critiques de sites ou d'entreprises, je remercie tout le monde de se limiter à discuter le fond et non la forme.

Quelqu'un avait-il déjà vu cela ?
Quelqu'un avait-il constaté comme moi ceci dans l'API ?
Haut
Messages: 589

Enregistré le: 13 Aoû 2004

Message le Sam Oct 23, 2004 22:54

OUI, moi , depuis plus de deux ans, sans pouvoir l'expliquez !
sur un de mes vieux sites, sur quelques requetes, j'ai ce phenomene !
Et sur le site en signature aussi maintenant !
cela prouve que c'est plus pertitnent ;)
( je n'utilise pas l'API )

Mais grace a l'article, cela m'a eclaircit , d'ou ce soleil ;)
Haut
Messages: 5963

Enregistré le: 22 Mar 2004

Message le Sam Oct 23, 2004 23:35

Effectivement...

Pour éviter toute dérive vers des critiques de sites ou d'entreprises, je remercie tout le monde de se limiter à discuter le fond et non la forme.

Quelqu'un avait-il déjà vu cela ?
Quelqu'un avait-il constaté comme moi ceci dans l'API ?


Non et en fait depuis que j'ai lu l'article je remarque le phénomène :) Par contre je me pose une question, a quoi ca peut bien servir pour l'internaute (c'est quand meme le but de google) de faire remonter une page (souvent la home) dans les résultats.

Je prend un exemple pour mon site pour la requete "choisir p*rtable" (c'est pas une requete très concurrentielle),

http://www.google.fr/search?hl=fr&q=cho ... able&meta=

je remarque que ma page choix p*rtable apparait en 4eme position (normal) et grace au clustering ma home apparait en 5ème... ok pour moi c'est une bonne chose, ca va me rapporter plus de visites mais pour l'internaute ou est l'interet ? Car en cliquant sur ma home il va chercher la page (ou pas d'ailleurs ) et va retomber sur la même page que le 4eme choix... Bref je comprends pas à quoi ca sert le clustering (a part privilégier les tricheurs) :?: , d'ailleurs quelqu'un sait si c'est plutot nouveau ou alors si ca existe depuis le début ?
Haut
Messages: 4909

Enregistré le: 17 Aoû 2004

Message le Dim Oct 24, 2004 10:44

l'excellent article de notre ami Alexis-Berger (que je découvre) est révélateur d'une notion importante dans le classement des pages ... c'est la notion de thématique ...

En effet, si sur une requète donnée, un domaine arrive à placer plus d'une page sur une même page de résultats (résultats proches) ... alors ce sont toutes les pages du domaine (répondant à la requète bien sûr) qui bénéficient de la meilleure position ...

Toutes ces pages faisant partie d'un même domaine, la pertinence de chacune de ces pages est renforcée vis à vis de la thèmatique considérée ... elles sont donc toutes considérées comme contribuant collectivement à la réponse ...
Haut
Messages: 4909

Enregistré le: 17 Aoû 2004

Message le Dim Oct 24, 2004 10:50

Non et en fait depuis que j'ai lu l'article je remarque le phénomène Par contre je me pose une question, a quoi ca peut bien servir pour l'internaute (c'est quand meme le but de google) de faire remonter une page (souvent la home) dans les résultats.

de toute façon le regroupement ne se fait que si tu sort au moins 2 pages d'un même domaine sur la même page de résultats ... alors regroupé ou pas, tu aurait pris tes 2 emplacements de toutes les manières ...

par contre à partir de 3 pages d'un même domaine, on commence à économiser des emplacements ... :wink:
Haut
Messages: 768

Enregistré le: 8 Fév 2003

Message le Dim Oct 24, 2004 11:50

l'excellent article de notre ami Alexis-Berger (que je découvre) est révélateur d'une notion importante dans le classement des pages ... c'est la notion de thématique ...


Désolé, mais non ! :cry:
La thématique n'a rien à voir là dedans.

Le clustering est un truc très ancien dans les moteurs de recherche, et la plupart des moteurs.

Le mot clustering est parfois utilisé pour des méthodes de regroupement de pages sur des critères de sémantique. Mais là, il s'agit d'une autre acception du mot, qui décrit un simple regroupement de pages lors du calcul de la page de résultats.

Ce clustering là, comme le décrit Alexis, ne fait que regrouper le premier résultat avec des pages appartenant au même site qui, sinon, seraient éparpillées tout au long du classement.

Je cite l'explication de Google :

Résultats affichés en retrait
Lorsque Google trouve plusieurs résultats sur le même site Web, le résultat le plus pertinent est affiché contre la marge gauche et les autres sont situés légèrement en retrait vers la droite.


Le fait que ces pages appartiennent ou non à la même thématique n'explique pas le phénomène... Le classement dans la page de résultat est fait à partir d'une note globale, combinant suivant une recette de cuisine connue du seul Google et en perpetuelle évolution, des dizaines de critères de "pertinence" différents.

Donc pour optimiser ses pages pour apparaître en mode clusterisé, il faut être capable de faire monter dans les N premiers résultats plusieurs pages. Point final.

Pour l'instant, de plus en plus de gens pensent qu'un critère thématique est employé par Google dans son algo.

Mais dans tous les cas, ce(s) critère(s) sont noyés parmi des dizaines d'autres dans l'algo, et il est donc théoriquement possible d'obtenir la clusterisation de deux résultats portant sur des thématiques différentes.

C'est possible théoriquement mais rarement observé dans la pratique, car il est plus probable que dans un site, deux pages différentes pertinentes sur la même requête parlent du même sujet.

Comme d'habitude, le problème ici est de bien faire la part des choses, et de ne pas confondre co-occurrence, correlation et relation de cause à effet.
Haut
Messages: 4909

Enregistré le: 17 Aoû 2004

Message le Dim Oct 24, 2004 13:14

Bonjour cariboo,

Résultats affichés en retrait
Lorsque Google trouve plusieurs résultats sur le même site Web, le résultat le plus pertinent est affiché contre la marge gauche et les autres sont situés légèrement en retrait vers la droite.

certes, Google explique qu'il le fait, mais il ne dit pas pourquoi ... et ce que l'on essayait d'analyser c'était justement le pourquoi (j'ai du mal à croire que cela soit uniquement pour des raisons "cosmétiques") ... :wink:

Alexis-Berger a écrit:Prenons, par exemple, le cas d'un site parlant exclusivement des "voitures Renault".
Google va repérer que la seule thématique de ce site est "voitures Renault".
Sur son site le webmaster va créer des pages qui représentent chacun des modèles de la marque "Renault Kangoo", "Renault Megane", etc.
Comme le contenu de ce site est très intéressant d'autres webmasters vont faire des liens en "deep" vers les pages de ce site.
C'est très important car cela va renforcer la thématique "voitures Renault" sur l'ensemble du site.
Grâce à cela ce site devrait obtenir sans problème une double liste sur la requêtes "voitures Renault".

il me semble que dans son article Alexis-Berger aborde clairement la notion de thématique, et je le rejoins ... mais bien sûr, n'étant comme lui pas dans le secret des dieux, cela ne reste qu'une hypothèse à vérifer ...

cariboo a écrit:Le classement dans la page de résultat est fait à partir d'une note globale, combinant suivant une recette de cuisine connue du seul Google et en perpetuelle évolution, des dizaines de critères de "pertinence" différents.

tout à fait d'accord, mais cela n'explique pas pourquoi Google les "regroupe" ?

cariboo a écrit:Le fait que ces pages appartiennent ou non à la même thématique n'explique pas le phénomène...

pourquoi pas ? et sinon que proposes tu ?
Haut
Messages: 768

Enregistré le: 8 Fév 2003

Message le Dim Oct 24, 2004 14:02

Je suis vraiment étonné que des gens aussi connaisseurs des moteurs semblent ne découvrir ce truc que maintenant.

Cette fonctionnalité s'appelle "domain name clustering". Il a été utilisé dans de nombreux moteurs par le passé.

En général (par exemple dans les anciennes versions d'Altavista), le domain name clustering consistait à ne montrer qu'une seule url par domaine (celle avec la note de pertinence la plus élevée). Les autres pages sont accessibles par un lien permettant d'avoir les pages du même domaine, mais moins bien notées...

C'est aussi la solution adoptée dans Fast/Alltheweb : une seule page montrée, toutes les autres pages sont accessibles par le lien "more hits".

Google a choisi de montrer deux pages, point ...

MSN dans sa version bêta montre deux résultats à la Google, puis donne accès aux autres résultats du site :

exemple :
-http://techpreview.search.msn.fr/results.aspx?q=se+loger+%C3%A0+Londres

Il y'a un exemple de domain clustering en plein milieu de la première page pour un de mes sites.

Le "domain name clustering" sert en fait à faire remonter dans les premières réponses des pages de domaine qui sinon auraient été repoussées dans les profondeurs du classement par les multiples pages mieux optimisées d'un ou plusieurs sites... La présence de multiples pages d'un même domaine sur une requête comportant peu de mots est très fréquente, il faut donc éliminer cette "pollution".

C'est la première arme utilisée et la plus simple à implémenter contre le spamdexing, volontaire ou involontaire.

Yahoo n'utilise pas le domain name clustering, voila ce que cela donne sur la même requête

http://fr.search.yahoo.com/search?ei=IS ... meta=vl%3D

On voit que l'on trouve des pages de mes sites squattant quatre positions sur les dix premières !!

Il s'agit de trois articles différents plus un duplicate content accidentel.

Sur Google, le site apparaissant en 11e position remonterait en 11-3 = 9e position, c'est à dire en première page de résultats !!

il me semble que dans son article Alexis-Berger aborde clairement la notion de thématique, et je le rejoins ... mais bien sûr, n'étant comme lui pas dans le secret des dieux, cela ne reste qu'une hypothèse à vérifer ...


Un coup de rasoir d'Ockkham permet d'éliminer cette hypothèse, qui n'explique rien de plus.

Ce que je dis, c'est que le domain name clustering fonctionne uniquement à partir de l'algo de base du moteur...
Haut
Messages: 7

Enregistré le: 22 Oct 2004

Message le Dim Oct 24, 2004 14:15

squawk a écrit:Bref je comprends pas à quoi ca sert le clustering (a part privilégier les tricheurs) :?: , d'ailleurs quelqu'un sait si c'est plutot nouveau ou alors si ca existe depuis le début ?


Dans mon souvenir ca existe depuis très longtemps.
Par contre je ne comprend pas pourquoi autant de membre présent ici semblent obsédés par la triche :?:
Vous bénéficiez d'un double résultat pour votre site alors est-ce que vous vous conssidérez comme un tricheur ?
Haut
Messages: 7

Enregistré le: 22 Oct 2004

Message le Dim Oct 24, 2004 14:18

Cendrillon a écrit:l'excellent article de notre ami Alexis-Berger (que je découvre) est révélateur d'une notion importante dans le classement des pages ... c'est la notion de thématique ...
de toute façon le regroupement ne se fait que si tu sort au moins 2 pages d'un même domaine sur la même page de résultats ... alors regroupé ou pas, tu aurait pris tes 2 emplacements de toutes les manières ...


Merci pour votre soutien :wink:
Haut