L'algorithme du PageRank expliqué
74 messages • Page 1 sur 5 • 1, 2, 3, 4, 5
Consultez la formation sur les stratégies de liens de WebRankInfo / Ranking Metrics
L'algorithme du PageRank expliqué
Bonjour à tous,
J'ai mis en ligne un article s'inspirant de l'excellent article (en anglais) de Ian Rogers expliquant l'algorithme du PageRank (en français) d'une manière compréhensible par tous, du mois je l'espère...
Cet article sera complété dans les jours qui suivent et d'autres exemples de liens inter-pages seront repris et "disséqués".
J'ai beaucoup simplifié la calculatrice de PageRank de WebWorkShop, pour en faire un outil facile à utiliser tout en découvrant les exemples.
immo.wildcroft.com/publication/article39.html
Tous vos commentaires et suggestions sont les bienvenus
Dan
J'ai mis en ligne un article s'inspirant de l'excellent article (en anglais) de Ian Rogers expliquant l'algorithme du PageRank (en français) d'une manière compréhensible par tous, du mois je l'espère...
Cet article sera complété dans les jours qui suivent et d'autres exemples de liens inter-pages seront repris et "disséqués".
J'ai beaucoup simplifié la calculatrice de PageRank de WebWorkShop, pour en faire un outil facile à utiliser tout en découvrant les exemples.
immo.wildcroft.com/publication/article39.html
Tous vos commentaires et suggestions sont les bienvenus
Dan
cariboo a écrit:Très chouette...![]()
Mais ma boule de cristal personnelle (:wink: ) m'indique que dans quelques jours, tu devras sans doute ajouter un chapitre supplémentaire à ton exposé...
Merci !
Le chapitre en plus est en cours de rédaction...
Dan
heu...
j'ai pas de boule de cristale moi!!!
mais bon....tant pis j'attendrai la date officielle alors....
vu que vous avez pas l'air ........causant là dessus...
merci dan, je m'exercerai ....sans doute un jour....quand j'aurais du courage...
j'ai pas de boule de cristale moi!!!
mais bon....tant pis j'attendrai la date officielle alors....
vu que vous avez pas l'air ........causant là dessus...
merci dan, je m'exercerai ....sans doute un jour....quand j'aurais du courage...
Re: L'algorithme du PageRank expliqué
hetzeld a écrit:
J'ai mis en ligne un article s'inspirant de l'excellent article (en anglais) de Ian Rogers expliquant l'algorithme du PageRank (en français) d'une manière compréhensible par tous, du mois je l'espère...
Tous vos commentaires et suggestions sont les bienvenus
Dan
Mille mercis pour l avoir mis en FRANCAIS !!!
Merci à Dan pour cette analyse.
C'est une piste de reflexion très intéressante.
Mais intuitivement , j'ai du mal à croire qu'un lien externe puisse faire perdre autant de
PR à un site.
Essayons de dépasser l'intuition. Faisons l'hypothèse que pour le 7ème exemple qu'il ne s'agisse pas d'une page externe qui soit liée par la page C mais d'une page interne. Cet exemple serait d'ailleurs très intéressant à présenter.
Dans le sixième exemple, la valeur totale des pages du site est de 9,66.
Dans le septième exemple, la valeur totale des pages du site serait de 7,19 (en ajoutant la nouvelle page).
Ma question est donc la suivante. L'ajout d'une page dans un site peut elle faire perdre autant de poids au PR global du site (somme des pages)?
Katia
C'est une piste de reflexion très intéressante.
Mais intuitivement , j'ai du mal à croire qu'un lien externe puisse faire perdre autant de
PR à un site.
Essayons de dépasser l'intuition. Faisons l'hypothèse que pour le 7ème exemple qu'il ne s'agisse pas d'une page externe qui soit liée par la page C mais d'une page interne. Cet exemple serait d'ailleurs très intéressant à présenter.
Dans le sixième exemple, la valeur totale des pages du site est de 9,66.
Dans le septième exemple, la valeur totale des pages du site serait de 7,19 (en ajoutant la nouvelle page).
Ma question est donc la suivante. L'ajout d'une page dans un site peut elle faire perdre autant de poids au PR global du site (somme des pages)?
Katia
Katia a écrit:Essayons de dépasser l'intuition. Faisons l'hypothèse que pour le 7ème exemple qu'il ne s'agisse pas d'une page externe qui soit liée par la page C mais d'une page interne. Cet exemple serait d'ailleurs très intéressant à présenter.
L'exemple que tu donnes serait malheureusement sans intérêt (sans vouloir t'offenser
Cela reviendrait donc exactement au même si cette page ne fait pas un lien en retour.
Cette perte, dans l'exemple 7, vient uniquement du fait que la page C (qui redistribuait tout à la page A par son lien retour) ne redistribue plus que la moitié à la page A et l'autre moitié à l'autre page.
Par contre, si cette page supplémentaire fait un lien en retour vers A, le PR de cette dernière monte à 5.07...
C'est facile à visualiser avec le calculateur.
Je rajoute cet exemple en ligne ... patiente 10 minutes.
<edit>C'est fait !
Dan
vous avez pas l'air ........causant là dessus...
Désolé pour ces mystères... Mais quelques modifications profondes du comportement de Google sont devenues clairement visibles maintenant.
Je crois que Dan, comme moi, attend un peu pour en être sûr, avant de se lancer dans des descriptions hasardeuses du phénomène.
Katia> Le calcul présenté par Dan est très, très simplifié pour des raisons didactiques. Je crois d'ailleurs que la "vraie" formule du PR utilisée par Google, est bien construite sur le schéma présenté, mais pourrait être plus complexe que ça.
Elle pourrait notamment contenir des coefficients de pondération subtils, constituant la "patte" de Google, qu'ils se garderont bien de révéler.
Le phénomène de "dilution" dont tu parles est assez spectaculaire, mais parce que les valeurs de départ de PR sont faibles. Dans la pratique, la valeur de départ du lien entrant (imaginons un PR Google de 5), ne sera pas de 1, mais de n^5 (valeur de n ?), dans ce cas la perte de PR relative est moindre...
Mais ce qui compense également dans la pratique, c'est l'existence de liens entrants, qui compense la dilution liée aux liens sortants.
cariboo a écrit:Désolé pour ces mystères... Mais quelques modifications profondes du comportement de Google sont devenues clairement visibles maintenant.
Je crois que Dan, comme moi, attend un peu pour en être sûr, avant de se lancer dans des descriptions hasardeuses du phénomène.
Google a déposé récemment un nouveau brevet qui permettrait un calcul du PR "on the fly".... mais c'est peut-être un peu prématuré d'aborder ce sujet.
Par contre, la formule sur laquelle j'appuie l'article est celle-là même publiée dans le document de Google décrivant l'algorithme. N'oublions pas que le PR n'est qu'une des variables intervenant dans le classement des résultats de recherche.
Je l'ai mentionné dans l'article, mais j'aurais peut-être dû l'écrire en rouge :
Les valeurs du calculateur sont des valeurs de calcul, sans aucune mise à l'échelle comme sur la toolbar. Il ne faut donc pas comparer les deux !
En reprenant le tableau d'équivalence "toolbar/réel" (pour autant qu'on soit en base 10), les exemples donnés auraient tous un PR0 ou PR1 affiché par la toolbar, pas plus !
Dan
Bon, Dan a vendu la mèche...
Oui, il semblerait que depuis Esmeralda, on serait passé à un update continu partiel, avec des pages deepfreshcrawlées, dotées d'un PR calculé "on the fly" et qui apparaissent directement dans les SERPs sans passer par la phase Googledance...
Le résultat, c'est que l'ordre des résultats change sans arrêt, d'un jour sur l'autre, à cause de l'effet combiné du round robin (tous les datacenters ne sont pas mis à jour simultanément), du veryfreshbot (les pages qui apparaissent avec une date de fraicheur), et du deepfreshbot (qui n'introduit que les pages des sites fréquemment crawlées).
Elément nouveau, et intéressant pour la suite : les pages introduites dans le cadre de du deepfreshbot semble bénéficier aussi d'une prime de fraicheur, moindre que pour le veryfreshbot, mais sensible...
Pour l'instant, ce processus ne concerne pas encore tous les sites...
Oui, il semblerait que depuis Esmeralda, on serait passé à un update continu partiel, avec des pages deepfreshcrawlées, dotées d'un PR calculé "on the fly" et qui apparaissent directement dans les SERPs sans passer par la phase Googledance...
Le résultat, c'est que l'ordre des résultats change sans arrêt, d'un jour sur l'autre, à cause de l'effet combiné du round robin (tous les datacenters ne sont pas mis à jour simultanément), du veryfreshbot (les pages qui apparaissent avec une date de fraicheur), et du deepfreshbot (qui n'introduit que les pages des sites fréquemment crawlées).
Elément nouveau, et intéressant pour la suite : les pages introduites dans le cadre de du deepfreshbot semble bénéficier aussi d'une prime de fraicheur, moindre que pour le veryfreshbot, mais sensible...
Pour l'instant, ce processus ne concerne pas encore tous les sites...
cariboo a écrit:Bon, Dan a vendu la mèche...
Si au moins cela rapportait autre chose que de la considération...
C'était bien un secret de Polichinelle, non ?
Sur une des pages de mon site ajoutée récemment (la traduction de google-watch), le PR varie constamment.
Comme le dernier article mis en ligne hier soir a été crawlé par Google ce matin, on pourra voir dans un ou deux jours s'il affiche un PR. Pour l'instant il a une barre grise.
Mise en ligne vers 17H dimanche (avec un lien sur page d'accueil par feed RSS)
Crawl de la page d'accueil hier 17:58:06 et découverte du lien par crawler12
Crawl de l'article ce matin 07:27:37 par crawler10
Top chrono !
Dan
-

WebRankInfo - Administrateur du site

- Messages: 15914
- Inscription: Ven Avr 19, 2002 19:51
Le pb récurrent avec ce genre d'articles, c'est les gens qui le lisent trop vite et pour qui les seules valeurs de PR qui leur parlent sont celles données par la toolbar (je sais, c'est le cas de tout le monde, mais il faut savoir faire abstraction). Et donc fatalement Dan tu auras souvent des remarques à propos de tes exemples où figurent des valeurs de PR.
Je pense franchement que ces exemples sont très didactiques, mais leur interprétation est souvent difficile à cause de ce changement d'échelle nécessaire pour relativiser.
Il est encore un peu tôt pour en parler, mais disons qu'il y aura très prochainement un nouvel outil qui devrait intéresser tous ceux qui s'intéressent au PR des pages de leur site...
Mystère !
Je pense franchement que ces exemples sont très didactiques, mais leur interprétation est souvent difficile à cause de ce changement d'échelle nécessaire pour relativiser.
Il est encore un peu tôt pour en parler, mais disons qu'il y aura très prochainement un nouvel outil qui devrait intéresser tous ceux qui s'intéressent au PR des pages de leur site...
Mystère !
hetzeld a écrit:L'exemple que tu donnes serait malheureusement sans intérêt (sans vouloir t'offenser) car il n'y a pas de notion intérieur/extérieur dans l'algorithme.
Dan
Parfait, on est à peu près d'accord là dessus.
Donc, entre l'exemple 6 et l'exemple 7, il n'y a qu'une seule différence (et pas 2) : le fait d'ajouter un lien vers une nouvelle page de son propre site!
Et résultat...la somme des pageranks pour l'ensemble des pages du site diminue (en comptant la nouvelle page bien sur).
Cela signifierait que d'ajouter un nouveau lien interne à son site lui ferait perdre globalement de la valeur.
Avant d'ajouter ce lien on a:
Page A 4.98
Page B 1.56
Page C 1.56
Page D 1.56
Somme des PageRank 9.66
Après avoir ajouté ce lien on a :
Page A 3.31
Page B 1.09
Page C 1.09
Page D 1.09
Page E 0.61
Somme des PageRank 7.19
C'est bien çà que tu veux démontrer?
Katia.
-

WebRankInfo - Administrateur du site

- Messages: 15914
- Inscription: Ven Avr 19, 2002 19:51
je viens d'essayer à l'instant d'aller revoir ces exemples 6 et 7 mais malheureusement la page de l'article de Dan ne s'affiche pas en entier... Je suis le seul ?
74 messages • Page 1 sur 5 • 1, 2, 3, 4, 5
Formation recommandée sur ce thème :
Formation Netlinking (liens et référencement) : apprenez ce qu'est réellement un bon lien pour le référencement et surtout comment en obtenir. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Google attaqué en justice
- Google a désigné le vainqueur du concours de programmation 2002
- Google change son algorithme de checksum de la Toolbar
- Alerte Google Dance ! Mise à jour du PageRank le 18/02/2006
- Google achète Kaltix
- PR10 : les meilleurs Google PageRank de la planète !
- Constatations sur le PageRank de Google
- Le cache de Google : description, explications
- Conclusion sur l'analyse du PageRank de Google
- Tout le monde parle du PageRank, mais c'est quoi ?
Consultez la description détaillée des produits ou services de Google suivants : Google PageRank
- Détection de pages similaires
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités








le forum