Précision sur les backlinks

Consultez la formation sur les stratégies de liens de WebRankInfo / Ranking Metrics


cariboo
WRInaute impliqué
WRInaute impliqué
 
Messages: 770
Inscription: 8 Fév 2003

Message le Dim Juil 04, 2004 18:53

Par contre les BL viennent de sites qui n'ont rien a voir en thématique..


Peu importe, tous les backlinks sont pris en compte dans l'algo. Donc, gagner des backlinks de PR 6 ou 7, quelle que soit la thématique, ne fait qu'améliorer le référencement.

Ce que répète GoogleGuy, et Matt Cutt plus récemment, c'est que les liens en provenance d'un site faisant autorité sur une thématique sont de meilleurs liens... et que faire des liens vers des faisant autorité sur une thématique ne fait pas de mal, et fait plutôt du bien. Logique, car cette politique crée une structure de liens typique d'un bloc de sites interconnecté (une communauté, ou un groupe de sites parlant de la même chose)

Dans une telle structure les fuites de PR sont minimisées...

arretez la chasse aux cariboo : ils sont ingénieurs motoristes chez Google !


:lol: pas grave, je n'ai pas de bois sur la tête. Je ne travaille pas chez Google, et je ne suis même pas ingénieur :wink:

tonguide
WRInaute passionné
WRInaute passionné
 
Messages: 1393
Inscription: 28 Nov 2003

Message le Lun Juil 05, 2004 1:59

Très instructifs, par contre je pense pas me trompé en disant que le sujet a une petite erreur
"Précision sur les backlists" au lieu de "Précision sur les backlinks" petite différence qd mm ;)
et pui merci cariboo pour ces infos ;)


ybet
WRInaute accro
WRInaute accro
 
Messages: 7566
Inscription: 22 Nov 2003

Message le Lun Juil 05, 2004 3:30

cariboo a écrit:N'est-ce pas cela qui puisse être la cause de ce qu'on appelle "prime à l'ancienneté" ? Un site ancien n'a-t-il pas tendance à bénéficier plus facilement qu'un nouveau d'un bon PR de bloc ?
Pas du tout... Les sites anciens bénéficient naturellement d'un meilleur référencement :
- ils sont souvent bien présents dans dmoz, et depuis longtemps
- ils sont connus, et ont acquis avec le temps de nombreux backlinks externes et de qualité

Bref, il n'y a rien dans l'algo de Google qui favorise les anciens sites. Ils sont juste intrinsèquement mieux référencés.


Pas si sûr que toi. J'ai mon ancien site (que j'appellerai la copie) et un site présent depuis 8 mois (lui DMOZ). J'ai normalement laissé la copie de coté, supprimé des rubriques, plus vraiment mis à jour, pas optimalisé pour les requêtes mais régulièrement, l'ancien présent depuis 5 ans, sans BL (pire pointe vers le nouveau) passe devant sans être optimalisé pour les requêtes "importantes". Peut-être vu le faible nombre de liens vers les pages internes mais...


cariboo
WRInaute impliqué
WRInaute impliqué
 
Messages: 770
Inscription: 8 Fév 2003

Message le Lun Juil 05, 2004 7:24

Ybet, tes anciennes pages et tes nouvelles sont différentes... Cela démontre une fois de plus que les backlinks et le PR ne font pas tout pour être bien classés, les autres critères sont aussi (plus ?) importants.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 18963
Inscription: 19 Avr 2002

Message le Lun Juil 05, 2004 16:27

Merci aux participants de cette discussion très intéressante, et notamment à Cariboo.
J'en profite pour rappeler à ceux qui ne le sauraient pas qu'un des articles décrivant l'algorithme du BlockRank développé par Kaltix avait été synthétisé et traduit ici : http://www.webrankinfo.com/analyses/etu ... ckrank.php
A l'époque j'avais pu discuter par email avec les auteurs, mais depuis leur rachat par Google c'est impossible :-(

Cariboo, j'aimerais bien si tu le veux qu'on détaille ce qu'on appelle un bloc (dans le BlockRank) car dans leurs articles, un bloc est en fait un sous-domaine, tout simplement, alors que dans ton idée c'est un ensemble de pages interconnectées.

Olivier


cariboo
WRInaute impliqué
WRInaute impliqué
 
Messages: 770
Inscription: 8 Fév 2003

Message le Lun Juil 05, 2004 20:35

Ah, ouf, j'avais peur que personne ne vienne me demander "mais d'où il sort ça", ce qui constitue forcément une réaction saine face à toute info diffusée sur un forum, quelle que soit sa réputation et (surtout) quelle que soit la réputation du diffuseur de l'info.

Sans Olivier, cela m'aurait amené à devoir réintervenir tout seul pour compléter tout cela :cry:

Je le répète tout le temps : ne croyez pas tout ce qui se dit sur les forums, croisez vos infos, conservez une attitude prudente et sceptique.

Bon, la question d'Olivier va me permettre de distinguer ce dont on peut être sûr à mon avis, ce qui relève d'une théorie hypothétique qui fonctionne aujourd'hui mais qui peut être démentie demain, et ce qui s'avère être une spéculation plus osée.

Sur l'utilisation du block rank : c'est à peu près sûr. C'est la seule méthode connue qui permet une indexation continue en continuant à calculer un pagerank. C'est la seule méthode qui permet, sans multiplier par cent le nombre de machines utilisées par Google, de calculer un pagerank thématique, visible dans le "site flavored search" et "le Personalized Web Search".

Ensuite l'explication par la seule structure des liens au sein d'un bloc est possible, c'est la première que je vous ai vendue, mais il s'avère que ce n'est pas la seule, et une autre, très proche est tout aussi valable (plus ? oui je crois)

Ce que tu dis est exact Olivier, dans leur article sur le blockrank, ils envisageaient de calculer un blockrank par sous domaine... J'ai écrit
Dans la pratique, il s'agit de sites traitant de la même thématique, ou appartenant à la même communauté.
Zut, j'aurais du dire "pages" au lieu de "sites". Bien relevé Olivier...

Parce que les blocs sont forcément réduits en fait:

Un "gros site" peut contenir plusieurs blocs
Un petit site peut appartenir à un bloc plus important (pourvu qu'il soit hautement interconnecté avec d'autres)
Dans ce système, il y'a aussi des tas de sites qui ne rentrent pas dans les cases (ils constituent probablement un bloc à eux tout seuls : hypothèse restant après un coup de rasoir d'Occkham).
Par contre il ne sert à rien de créer un bloc entre sites faiblement connectés, et même moyennement connectés.
Donc il ne faut pas imaginer des blocs composés de centaines de sites, mais des blocs de centaines de pages...

Par ailleurs, je pense que nos amis de Kaltix ont dû franchir obligatoirement l'étape suivante, qui était "zappée" dans leurs premières expériences... Ce qui manquait dans leur article, c'était la description de la méthode qui permettait de repérer les "bons blocs"... Parce que calculer un blockrank sur geocities dans son ensemble (exemple étudié dans l'article), qui contient des milliers de sites non interconnectés entre eux, ce n'est pas forcément une bonne idée...

Il est clair qu'ils ont dû élaborer des techniques permettant de déterminer quels étaient les "meilleurs blocs", ceux qui convergent le plus vite... Sans cela, l'applicabilité de leur algo à un index de la taille de Google était peu viable. Ils annonçaient cette étape suivante dans leur article.

Il existe de nombreux papiers sur des algos qui permettent de "détecter" de tels groupes de pages... Et ces algos ne se basent pas sur les domaines ou sous domaines, donc un "bloc" ainsi repéré peut déborder sur d'autres sous domaines, voire différents domaines...

Bref, ce que l'on ne connait pas, c'est la taille des blocs. Du coup, la "sensibilité à la thématique" s'explique de deux manières différentes suivant que l'on considère la taille des blocs :
- s'il s'agit de tout petits blocs : la structure des liens n'explique plus le bonus en provenance de sites faisant autorité. Dans ce cas, elle résulte d'un clustering global doublé de calculs de pagerank thématiques pour chaque bloc (il est à peu près sûr que le clustering et le calcul des pagerank thématiques fonctionnent)
- s'il s'agit de très grands blocs : la structure des liens explique seule l'influence des "bons liens" émanant de la même thématique...

La première hypothèse est donc celle dont je n'ai pas encore parlé... Dans le calcul d'un pagerank thématique, on commence par rassembler un groupe de sites faisant autorité (tiens tiens) au hasard l'annuaire DMOZ (tiens tiens), on regroupe le tout en thématiques plus générales (en s'aidant d'un algo de clustering et de classification), et on lance un calcul de pagerank en partant des sites faisant autorité sur une thématique.

Dans ce cas, si on obtient des liens de sites "authority" et que l'on fait des liens vers sites de la même thématique / communauté, cela maximise le PR thématique (ça c'est sûr).

Si cette deuxième hypothèse est vraie, cela permet d'utiliser le PR thématique pour améliorer la pertinence de certaines requêtes... Imaginez un filtre qui tienne compte du PR thématique pour "virer" de l'index certaines pages artificiellement référencées sur certains mots clés, cela risque de faire mal.

Ah mais tiens au fait ? Qu'est-ce qui s'est passé cet été ? N'a-t'on pas vu disparaître des centaines de pages sur certains mots clés, justement des pages artificiellement référencées ?

Là, c'est juste une théorie qui marche, jusqu'à ce qu'une meilleur explication soit donnée. Je la trouve juste plus conforme à la réalité de ce qui est observé aujourd'hui, que les filtres bayesiens ou l'algo hilltop.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 18963
Inscription: 19 Avr 2002

Message le Mar Juil 06, 2004 9:34

en voilà des discussions intéressantes :roll:
on lance un calcul de pagerank en partant des sites faisant autorité sur une thématique.
je ne vois pas ce que tu veux dire par "en partant des sites...". même s'il est restreint à un bloc, le calcul du PR reste itératif je pense. peux-tu préciser ce que tu as voulu dire ?

à part ça, je pense que la question la plus logique suite à cette discussion est la suivante : comment peut-on estimer l'importance du PR thématique ? comment peut-on le mesurer ou prouver (par un exemple) qu'il existe bien ?

:arrow: histoire de faire avancer un peu + le schmilblick :P
Olivier


ams51
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 289
Inscription: 22 Mar 2004

Message le Mar Juil 06, 2004 9:42

WebRankInfo a écrit:à part ça, je pense que la question la plus logique suite à cette discussion est la suivante : comment peut-on estimer l'importance du PR thématique ? comment peut-on le mesurer ou prouver (par un exemple) qu'il existe bien ?


On peut partir de 2 sites différents dans le contenu mais similaires dans l'architecture (pour ne pas trop fausser les résultats) avec une thématique bien précise et essayer de trouver des partenaires dans une catégorie Dmoz qui correspond au thème pour l'un et completement différente pour l'autre en essayant d'équilibrer le nb de page et le PR
Et refaire ça sur plusieurs thèmes avec plusieurs sites pour ne pas avoir qu'un seul exemple....

Un énorme travail pour peut etre pas grand chose.... je pense que ça restera une hypothèse pour le moment


herveG
Modérateur
Modérateur
 
Messages: 9919
Inscription: 5 Mar 2003

Message le Mar Juil 06, 2004 9:42

Super intéressant. cela expliquerait ausis le bon en positionnement effectués par les pages des sites fraichement présente sur DMOZ apres la mise a jour du google directory.....! possible que ces nouvelles pages profitent alors de l´effet "blockrank" du DMOZ en terme de PR thématique.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 18963
Inscription: 19 Avr 2002

Message le Mar Juil 06, 2004 9:55

il faudrait identifier s'il s'agit de DMOZ ou du répertoire Google, ce dernier n'étant remis à jour que rarement (tous les 3 mois environ ?)


herveG
Modérateur
Modérateur
 
Messages: 9919
Inscription: 5 Mar 2003

Message le Mar Juil 06, 2004 10:17

Je n avais pas constaté d´amélioration à la simple inscritpion dans le DMOZ mais seulement lorsque la catégorie DMOZ a été indiquée dans les resultats google. Ce qui pourrait indiquer qu´il faille attendre non seulemement la MAJ du google directory mais surtout la prise en compte de la MAJ dans les resultats google.

Cela dit, je ne m´etais pas posé la question à ce moment là , ca pourrait donc valoir le coup que quelqu un qui vient juste de proposer sont site sur DMOZ fasse un état des lieu de son positionnement aujourd´hui, puis a l inscription DMOZ, puis a la MAJ du google directory et enfin lorsque les resultats google prendront en compte les infos du directory.

et le tout..... sans faire de modifs ou d echanges de liens au cours de ces periodes (pas facile donc !!)


midnightfr
WRInaute impliqué
WRInaute impliqué
 
Messages: 529
Inscription: 12 Mar 2004

Message le Mar Juil 06, 2004 16:56

Il me semble que les blocs pourraient être determinés par le dmoz. Ca permet a google de regrouper les sites par thématique.
Ce qui est sur en tout cas, c'est que d'obtenir des liens de sites de la meme catégorie dmoz est meilleur que des liens d'une autre catégorie. Et cela parce que le PR se dilue dans la meme catégorie, est récupéré par l'annuaire, et est redistribué aux sites de la catégories.
Mon explication vous semble claire?


cariboo
WRInaute impliqué
WRInaute impliqué
 
Messages: 770
Inscription: 8 Fév 2003

Message le Mar Juil 06, 2004 20:43

A propos de DMOZ et du pagerank thématique.

En fait, les gens de kaltix ont pondu toute une série d'articles sur ces sujets là. Leur papier sur le pagerank thématique est un papier plus ancien que celui sur le block rank. Dans ce papier ils décrivaient le modus operandi qu'ils avaient suivi : ils partaient d'un jeu réduit de sites, chosis dans l'ODP, et avaient établi seize thématiques à partir des seizes répertoires de niveau 1 de l'ODP.

Comme les gars de Kaltix montraient déjà à l'époque que le choix de l'ODP donnait d'excellents résultats en terme de pertinence, il est probable selon moi qu'ils ont repris comme source l'ODP ou le répertoire Google pour leurs calculs de pagerank thématique. Pourquoi aller chercher ailleurs ce qu'ils ont à portée de la main.

C'est pourquoi j'ai fait allusion à DMOZ comme "source possible" de sites autorité pour "amorcer" le calcul du pagerank thématique. Mais ce n'est pas une obligation, le répertoire de Google doit marcher aussi, évidemment.

Pour l'histoire du PR et du calcul iteratif : oui le pagerank reste un calcul iteratif. Sauf que pour créer ce PR thématique, on ne prend en compte que la matrice des liens de pages reliées à une série de pages autorité, qui sont dans la thématique.

On calcule autant de pagerank différents que de groupes de sites thématiques de départ. La structure de liens qui sert de base au calcul du pagerank étant différente (on ne travaille que sur une partie limitée du web), les valeurs de PR obtenues sont différentes du PR global.

Dans ce contexte, le blockrank a deux avantages : en diminuant le nombre de "noeuds" à calculer, il rend faisable la génération de dizaines, voire de centaines de pageranks. Sinon, il aurait fallu à google développer une puissance de calcul gigantesque. Sur un plan théorique, les "sauts" du promenoir aléatoire sont également très raccourcis puisque l'on ne travaille que sur la matrice de transitions, et que les blockranks convergent en quelques itérations.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 18963
Inscription: 19 Avr 2002

Message le Mar Juil 06, 2004 20:52

cariboo, as-tu des idées sur :
à part ça, je pense que la question la plus logique suite à cette discussion est la suivante : comment peut-on estimer l'importance du PR thématique ? comment peut-on le mesurer ou prouver (par un exemple) qu'il existe bien ?


cariboo
WRInaute impliqué
WRInaute impliqué
 
Messages: 770
Inscription: 8 Fév 2003

Message le Mar Juil 06, 2004 22:38

Je pense que ce qui sert au classement des pages de résultat de Google encore aujourd'hui, c'est un PR "normal".

Mais, les "outils" présentés dans Google Labs démontrent que l'index de Google contient aussi des PR thématiques. Sans PR thématique, les outils de Kaltix ne pourraient pas fonctionner.

(attention, il y'a probablement beaucoup moins de PR thématiques que de rubriques de personnalisation proposées dans les outils de Kaltix).

Maintenant, en dehors des outils présenté dans Google Labs, à quoi sert le PR thématique dans l'index de Google ?

A mon avis, pour l'instant, à peu de chose. Mais demain peut-être... J'ai dit ailleurs que les "conseils" des gens de Google sonnaient comme des avertissements...

Le PR thématique n'est utilisable que dans un moteur de recherche sensible au contexte. Il sert à renvoyer des pages de résultats qui parlent de zoologie et d'animaux quand on tape jaguar et que l'on cherche des infos sur ce félin, et non des concessionnaires automobiles... Sauf que quand on tape jaguar dans Google, Google n'a aucun moyen de savoir si on cherche un félin ou une voiture... Bref, impossible de savoir le PR thématique à utiliser pour classer les réponses...

Par contre, visiblement tout est prêt pour passer à l'étape suivante qui serait la personnalisation des résultats selon le profil entré par l'internaute et/ou l'enregistrement des requêtes successives pour comprendre le contexte de recherche, et/ou l'interrogation du moteur en langage naturel.

Si MSN ou Yahoo veulent sortir demain un moteur plus pertinent, Google a déjà sa réplique prête...

Le PR thématique peut servir aussi à autre chose dès aujourd'hui... Si l'on reprend l'idée de calculer un PR volontairement biaisé en ne considérant que sites reliés à des sites faisant autorité, on peut aussi créer des PR dont la valeur n'indique plus une popularité dans un groupe de pages thématiques, mais la popularité dans un groupe de pages ... faisant autorité.

Ce qui permet de faire des filtres très efficaces pour supprimer de certaines pages de résultats des url qui n'ont rien à faire dans un contexte donné (sites sans backlinks "fiables")

Je n'ai aucune preuve, mais comme la technologie est là, pourquoi ne pas l'utiliser ? Cela expliquerait le fonctionnement du fameux "filtre anti sites commerciaux" qui a tant fait couler d'encre sur les forums anglo saxons. Et les conseils des gens de Google. Ce qui voudrait dire alors que Google calcule des PR thématiques (plus généralement des PR biaisés, ou "flavored PR") depuis la rentrée 2003...

Comment savoir si le PR thématique est réellement utilisé pour classer les url dans les pages de résultats ? Pas facile. Mais alors vraiment pas facile... Quelques expériences peuvent démontrer, avec beaucoup de patience, une influence anormale de certains backlinks sur les classements (inexplicables par l'algo classique). Il y'a tellement de paramètres que seule des méthodes statistiques sur de nombreuses pages de sites différents pourraient donner un commencement d'idée... Surtout qu'à mon avis, si filtre à PR biaisé il y'a, il n'est pas appliqué partout...

Précision sur les backlinks Précision sur les backlinks

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation Netlinking (liens et référencement) : apprenez ce qu'est réellement un bon lien pour le référencement et surtout comment en obtenir. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Analyse des backlinks
    Cet outil vous permet d'analyser en détails la "popularité" de votre site sur Google. En plus du nombre de liens pris en compte par Google, il calcule le pourcentage de liens internes parmi tous les liens, et il affiche les premières URL trouvées.
  • Analyser le référencement Google
    Cet outil vous donne un petit résumé de l'état de référencement de votre site dans Google.
  • Partenaires pour échanges de liens
    Cet outil vous liste quelques sites qui font des liens vers des sites similaires au vôtre, pour vous aider à trouver des partenaires pour des échanges de liens.
  • Recherche de citations d'un site en texte brut
    Cet outil vous permet de trouver des pages citant votre site mais ne faisant pas (encore) de lien. Il suffira parfois d'un simple mail pour transformer cette simple citation en lien (backlink).


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité