Ma théorie sur la sandbox
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Cette histoire de beaucoup de bl d'un coup j'ai toujours pas compris en quoi et pourquoi gg pourrait considérer ça comme néfaste.
Imganinons qu'une grosse boite décide de faire un nouveau site, par exemple pour un jeu, si elle communique un peu (presse, pub), le site aura rapidement des dizaines de milliers de BL, pourquoi gg considererait ça comme de la "triche" ?
Sinon ce qui me gêne dans les hypothèses de Rituel, c'est que c'est basé sur rien et qu' il y a en plus des contre exemples pour pratiquement toutes les hypothèses.
Je pense qu'on devrait essayer de profiter de ce topic pour continuer à faire des hypothèses, mais essayer aussi de trouver des tests qu'on pourrait faire pour réellement faire avancer le smilblick de manière plus "scientifique"
Moi mon sentiment sur la question (un peu comme disait lafleur) c'est plutot que Google accorde de l'importance a "étudier la qualité des BL" (alors qu'avant il se contentait du pr de la page) et prend du temps pour faire ça, d'ou cette effet de prise en compte des BL décalé dans le temps.
Imganinons qu'une grosse boite décide de faire un nouveau site, par exemple pour un jeu, si elle communique un peu (presse, pub), le site aura rapidement des dizaines de milliers de BL, pourquoi gg considererait ça comme de la "triche" ?
Sinon ce qui me gêne dans les hypothèses de Rituel, c'est que c'est basé sur rien et qu' il y a en plus des contre exemples pour pratiquement toutes les hypothèses.
Je pense qu'on devrait essayer de profiter de ce topic pour continuer à faire des hypothèses, mais essayer aussi de trouver des tests qu'on pourrait faire pour réellement faire avancer le smilblick de manière plus "scientifique"
Moi mon sentiment sur la question (un peu comme disait lafleur) c'est plutot que Google accorde de l'importance a "étudier la qualité des BL" (alors qu'avant il se contentait du pr de la page) et prend du temps pour faire ça, d'ou cette effet de prise en compte des BL décalé dans le temps.
@Bebez : Je pense qu'une seule courbe serait trop imprécise pour le nombre de sites qu'il existe, en fait chaque site a son évolution mais on peut la rapprocher de l'évolution d'un autre site qui lui même peut être rapproché avec un autre, seulement à force de rapprocher on commet des erreurs de jugement, d'où peut être l'existence de plusieurs référentiels.
@Webrankinfo : Je ne l'ai pas vérifié, j'ai émis des hypothèses face à de nombreux phénomènes reportés sur des forums américains, et également ici.
Etant moi même programmeur, j'ai essayé de trouver quelque chose de techniquement faisable et de difficilement contournable donc de valable pour juger de la véracité de l'évolution d'un site, mais bien que j'ai dû commettre des erreurs d'appreciations, je pense que la ligne directrice est vraie.
Pour le lien vers Fleurs livraison, je ne sais pas trop ce que cela donnerait, j'ai encore plein d'interrogations, peut être que Google peut déplacer un site d'un référentiel à un autre si son évolution semble naturelle mais explosive, c'est le marketing viral qui m'a fait réflechir là dessus ... Je t'avoue que je ne préfère pas m'aventurer sur cette question qui est peut être le talon d'Achille de mon explication.
Pour le comptage des BLs d'un même domaine c'est un autre problème, mais il est clair qu'il ne vaut pas la même chose qu'un BL normal et j'en ai la preuve : Le site de voyage d'un ami a pour partenaire un des plus gros sites francophones : Gros en taille, et gros en fréquentation, pour tout vous dire un générateur de forums
Résultat : Avec plus de 10 000 BLs, il était seulement PR 4 et perdu très très loin dans le classement.
Pour ce qui est d'échapper à l'effet sandbox, tout simplement Fleurs Livraison : Dès sa première indexation il s'est retrouvé premier sur le mot "livraison", alors qu'il était 70 ème sur "livraison fleurs", depuis il ne cesse de grimper et il se retrouve aujourd'hui 16 ème sur ce même terme après seulement quelques mois d'existence.
Mais après tout ta thèse ouvre peut être une piste, l'effet sandbox est peut être non pas appliqué à un site seul, mais à un site + une requête concurentielle du même thème que le site ... Mais là ca devient vraiment complexe ...
En conclusion ce que l'on peut dire c'est que l'on a pas affaire à n'importe qui, Google comprend très bien tout ce que l'on fait, il reste principalement basé sur la popularité d'un site pour en déterminer le classement d'où ses algorithmes de chasse aux fraudeurs de BLs ( Que vous pouvez appelle Sandbox si cela vous fait plaisir
) ,et, s'il existe encore des abus au niveau du cloaking et des redirections, cela devrait ,je pense, rapidement changer.
@Webrankinfo : Je ne l'ai pas vérifié, j'ai émis des hypothèses face à de nombreux phénomènes reportés sur des forums américains, et également ici.
Etant moi même programmeur, j'ai essayé de trouver quelque chose de techniquement faisable et de difficilement contournable donc de valable pour juger de la véracité de l'évolution d'un site, mais bien que j'ai dû commettre des erreurs d'appreciations, je pense que la ligne directrice est vraie.
Pour le lien vers Fleurs livraison, je ne sais pas trop ce que cela donnerait, j'ai encore plein d'interrogations, peut être que Google peut déplacer un site d'un référentiel à un autre si son évolution semble naturelle mais explosive, c'est le marketing viral qui m'a fait réflechir là dessus ... Je t'avoue que je ne préfère pas m'aventurer sur cette question qui est peut être le talon d'Achille de mon explication.
Pour le comptage des BLs d'un même domaine c'est un autre problème, mais il est clair qu'il ne vaut pas la même chose qu'un BL normal et j'en ai la preuve : Le site de voyage d'un ami a pour partenaire un des plus gros sites francophones : Gros en taille, et gros en fréquentation, pour tout vous dire un générateur de forums
Résultat : Avec plus de 10 000 BLs, il était seulement PR 4 et perdu très très loin dans le classement.
Pour ce qui est d'échapper à l'effet sandbox, tout simplement Fleurs Livraison : Dès sa première indexation il s'est retrouvé premier sur le mot "livraison", alors qu'il était 70 ème sur "livraison fleurs", depuis il ne cesse de grimper et il se retrouve aujourd'hui 16 ème sur ce même terme après seulement quelques mois d'existence.
Mais après tout ta thèse ouvre peut être une piste, l'effet sandbox est peut être non pas appliqué à un site seul, mais à un site + une requête concurentielle du même thème que le site ... Mais là ca devient vraiment complexe ...
En conclusion ce que l'on peut dire c'est que l'on a pas affaire à n'importe qui, Google comprend très bien tout ce que l'on fait, il reste principalement basé sur la popularité d'un site pour en déterminer le classement d'où ses algorithmes de chasse aux fraudeurs de BLs ( Que vous pouvez appelle Sandbox si cela vous fait plaisir
Perso je crois que moyennement aux courbes, mais c'est une bonne maniere de representer le probleme.
Je pencherais plutot sur des plages de valeurs que Google accepte comme raisonnables pour l'evolution de differents parametres.
D'apres moi faut pas simplement se focaliser sur le nombre de backlinks, mais sur l'ensemble des facteurs qui changent quand un grand nombre de liens est ajoute de maniere artificielle (diversite de la provenance, reputation des sites, densite des mots cles dans les liens, etc.)
Si plusieurs de ces facteurs changent de maniere drastique d'un passage de spider a l'autre, il y a de fortes chances que Google decide que ce ne soit pas dans le meilleur interet des surfeurs de voir ce site en premiere page.
C'est une theorie que j'avais verifiee sur plusieurs parametres differents deja avant Florida. J'avais appele ca "la theorie des deltas".
Depuis il y a pas mal de parametres qui se sont ajoutes, mais d'apres moi elle reste valide.
Je pencherais plutot sur des plages de valeurs que Google accepte comme raisonnables pour l'evolution de differents parametres.
D'apres moi faut pas simplement se focaliser sur le nombre de backlinks, mais sur l'ensemble des facteurs qui changent quand un grand nombre de liens est ajoute de maniere artificielle (diversite de la provenance, reputation des sites, densite des mots cles dans les liens, etc.)
Si plusieurs de ces facteurs changent de maniere drastique d'un passage de spider a l'autre, il y a de fortes chances que Google decide que ce ne soit pas dans le meilleur interet des surfeurs de voir ce site en premiere page.
C'est une theorie que j'avais verifiee sur plusieurs parametres differents deja avant Florida. J'avais appele ca "la theorie des deltas".
Depuis il y a pas mal de parametres qui se sont ajoutes, mais d'apres moi elle reste valide.
trix a écrit:Perso je crois que moyennement aux courbes, mais c'est une bonne maniere de representer le probleme.
Je pencherais plutot sur des plages de valeurs que Google accepte comme raisonnables pour l'evolution de differents parametres.
Tu ne peux pas faire des plages uniques avec lesquelles tu jugeras 8 milliards de sites, c'est impossible, d'où les courbes. La différence entre une plage et les courbes representées, finalement c'est qu'une plage est une droite verticale x=constante sur mon schéma, alors que les courbes sont une infinité de droites x=constante
D'apres moi faut pas simplement se focaliser sur le nombre de backlinks, mais sur l'ensemble des facteurs qui changent quand un grand nombre de liens est ajoute de maniere artificielle (diversite de la provenance, reputation des sites, densite des mots cles dans les liens, etc.)
Tout à fait, olivier l'a d'ailleurs notifié :
Je pense que c'est sur le schéma des liens (nb de sites différents, origine des sites, adresses IP, format des liens, etc.) qu'il peut y avoir des analyses faites par Google (et qui nous échappent).
Et le lui ai d'ailleurs répondu :
Tout à fait, ce doit également être des arguments de sandboxage, mais au contraire, ceux là ne nous échappent pas car ils sont bien plus logiques et faciles à detourner que la courbe de croissance. Ils sont donc pour moi un complèment au sandboxing mais sont trop évidents et simple à contourner pour être les seuls en piste.
Il y'a peut être aussi la Toolbar dont on doit se méfier ... Elle peut servir à établir des statistiques en terme de fréquentation et joue peut être sur le classement (Ce qui serait dommage).
Pour le reste pourquoi pas, tout est envisageable vu le mastondonte à qui on a affaire
Le truc que me plait pas dans les courbes c'est que ca signifierais qu'un site qui resterait dormant pendant 3 mois devrait mettre un gros coup pour retourner dans la norme. C'est pas particulierement coherent avec ce que j'ai vu sur certains de mes domaines.
Le truc dont il faut aussi se souvenir quand on se frotte a Google c'est qu'ils ont une base absolument enorme de sites qu'ils ont vu evoluer dans le temps. La taille de la base est pas du tout un probleme pour eux, c'est au contraire un avantage. Une fois qu'il ont determine les parametres d'une formule qui permet de decider si les changements sont coherents avec le reste de leur base, ils ont pas a faire de calculs compliques sur toute la base. Ils font tourner certains filtres uniquement sur les premieres N pages de resultats pour les expressions les plus interessantes.
D'apres moi c'est d'ailleurs ce qui peut expliquer le phenomene de sandbox:
Un site fait un bond supernaturel sur un des parametres -> il est dans les sites potentiellement interessants sur des "expressions surveillees", Google regarde son evolution et determine que l'evolution n'est probablement pas naturelle -> le site est supprime des sites a considerer dans la partie de la base la plus active (sites qui apparaissent dans les N premieres pages des expressions interessantes).
Quand le webmaster s'est calme et que les parametres de son site recommencent a evoluer de maniere acceptable, il est de nouveau considere avec les pages standard.
Le truc dont il faut aussi se souvenir quand on se frotte a Google c'est qu'ils ont une base absolument enorme de sites qu'ils ont vu evoluer dans le temps. La taille de la base est pas du tout un probleme pour eux, c'est au contraire un avantage. Une fois qu'il ont determine les parametres d'une formule qui permet de decider si les changements sont coherents avec le reste de leur base, ils ont pas a faire de calculs compliques sur toute la base. Ils font tourner certains filtres uniquement sur les premieres N pages de resultats pour les expressions les plus interessantes.
D'apres moi c'est d'ailleurs ce qui peut expliquer le phenomene de sandbox:
Un site fait un bond supernaturel sur un des parametres -> il est dans les sites potentiellement interessants sur des "expressions surveillees", Google regarde son evolution et determine que l'evolution n'est probablement pas naturelle -> le site est supprime des sites a considerer dans la partie de la base la plus active (sites qui apparaissent dans les N premieres pages des expressions interessantes).
Quand le webmaster s'est calme et que les parametres de son site recommencent a evoluer de maniere acceptable, il est de nouveau considere avec les pages standard.
Dernière édition par trix le Sam Jan 15, 2005 20:11, édité 1 fois.
Trix, j'ai finalisé mon article et curieusement ca semble concorder un peu avec tes interrogations :
- Code: Tout sélectionner
Après avoir lu cet article, une question vous viendra peut être à l'esprit : Si un site est mis en sandbox, comment peut il en ressortir si son nombre de Bls est largement supérieur au maximal autorisé par la courbe ? Devra-t-il attendre plusieurs mois, voire plusieures années avant de réapparaître dans les résultats ?
Bien qu'on m'ai reporté des cas extrêmement longs de mise à l'écart de sites par Google, je doute qu'il faille attendre que la courbe atteigne le seuil de BLs du site avant que celui-ci puisse réintégrer le classement, en effet cela signifierai qu'une centaine de Backlinks le replongerait dans la sandbox ... Mais rappellez vous, tout à l'heure nous avons évoqué le fait qu'il devait forcément exister plusieures courbes selon le nombre de backlinks à la naissance. Pour pallier à notre problème il suffirait donc qu'après une mise en bac à sable Google transfère le site dans un référentiel supérieur qui correspond davantage au cycle de vie que ce dernier a prit.
-

Cendrillon - WRInaute accro

- Messages: 4747
- Inscription: Mar Aoû 17, 2004 15:41
rituel, je ne sais pas si ta théorie est exacte, mais après tout elle en vaut bien d'autres ... mais pourquoi ne pas la généraliser et imaginant :
1- Google ne s'intéresse pas qu'aux paramètres eux même mais à leur vitesse de variation (dérivée). Dès lors la valeur de départ n'aurait plus d'importance (avec des gardes fou bien sûr), du moment que la vitesse de variation reste constante (dans une gaine de tolérence) ...
2- pourquoi ne le ferait il qu'au début de la vie d'un site, et plus ensuite ... cela pourrait expliquer que certains sites anciens attérrissent dans la SandBox ...
Si c'était le cas, j'ose espérer que les concepteurs d'un tel algorithme auront prévu un effet d'hystérésis ...
1- Google ne s'intéresse pas qu'aux paramètres eux même mais à leur vitesse de variation (dérivée). Dès lors la valeur de départ n'aurait plus d'importance (avec des gardes fou bien sûr), du moment que la vitesse de variation reste constante (dans une gaine de tolérence) ...
2- pourquoi ne le ferait il qu'au début de la vie d'un site, et plus ensuite ... cela pourrait expliquer que certains sites anciens attérrissent dans la SandBox ...
rituel a écrit:Bien qu'on m'ai reporté des cas extrêmement longs de mise à l'écart de sites par Google, je doute qu'il faille attendre que la courbe atteigne le seuil de BLs du site avant que celui-ci puisse réintégrer le classement, en effet cela signifierai qu'une centaine de Backlinks le replongerait dans la sandbox ...
Si c'était le cas, j'ose espérer que les concepteurs d'un tel algorithme auront prévu un effet d'hystérésis ...
Dernière édition par Cendrillon le Sam Jan 15, 2005 22:19, édité 1 fois.
-

WebRankInfo - Administrateur du site

- Messages: 15905
- Inscription: Ven Avr 19, 2002 19:51
au fait, pourquoi dites-vous "la" sandbox ? parce que box est du féminin ? vous préférez dire "le" ou "la" sandbox ?
-

Cendrillon - WRInaute accro

- Messages: 4747
- Inscription: Mar Aoû 17, 2004 15:41
certainement parce que, comme l'a très bien expliqué Magdane, ont dit : "une" catastrophe, "une" galère, "une" tornade, "une" épidemie, "une" hécatombe, "une" désindexation et "une" SandBox, etc ... 
Dernière édition par Cendrillon le Sam Jan 15, 2005 22:20, édité 1 fois.
-

WebRankInfo - Administrateur du site

- Messages: 15905
- Inscription: Ven Avr 19, 2002 19:51
pour ceux que ça intéresse, l'article de rituel est publié ici : Théorie sur la sandbox
@Cendrillon: Pour le premier point c'est fort possible en effet
Pour le deuxième point je suis d'accord mais les webmasters semblent plus souvent faire part de ce phénomène pour des sites récents, mais pourquoi pas ? Ca peut également être dû à l'inverse de l'effet sandbox, à savoir passer de la zone normale (verte) à la zone grise tu ne penses pas ?
Pour le deuxième point je suis d'accord mais les webmasters semblent plus souvent faire part de ce phénomène pour des sites récents, mais pourquoi pas ? Ca peut également être dû à l'inverse de l'effet sandbox, à savoir passer de la zone normale (verte) à la zone grise tu ne penses pas ?
dh a écrit:slt
et concernant les sites qui ne font pas la course aux bl
alors que presents dans les 1er resultats sur des requetes "concurentielles"
bien que je trouve beaucoup de choses interessantes dans l'étude de Rituelle, je pense aussi que l'on fait beaucoup trop de tapage sur les Bls
j'ai un site en pr 5 sans aucun lien exterieur(un seul a existé au départ afin que les moteurs le trouvent), juste des liens internes
maintenant j'ai 3 cas différents qui tenteraient à prouver que les vieux sites (les vieux bébés comme pourrait dire Rituelle) sont plus cajolés que les autres
1- site de 1999 avec moins de 200 pages, pr6, completement abandonné entre 2001 et 2004
courant 2004, ajout de plusieurs milliers de pages avalées en moins d'un mois et çà cartonne sur des requetes tres concurrentielles
le site est repassé en pr5 depuis la derniere gg d'une facon inexpliquée mais çà n'a strictement rien changé au niveau du positionnement et du trafic
2 - site de 2003 avec moins de 200 pages (bébé qui perce sa premiere dent) ,pr5, ajout de 1000 pages fin decembre 2004, meme technique d'optimisation que le site sus-nommé
les 1000 pages ont été avalées par google le 2 janvier, c'est un secteur tres concurrentiel
le site sort tres bien sur des requetes qui donnent moins de 50 000 resultats et sort au-dela de la 300 place pour le reste
je precise (de nouveau) que la technique est la meme que le premier site et sur les memes requetes, donc l'age du site est un critere essentiel, les bls n'ont rien à voir et la multiplication soudaine du nombre de pages non plus
3- site créé le 1er janvier 2005,pr0, un seul bl exterieur, 180 pages
le 3 janvier google avait deja visité toutes les pages et repasse tous les jours
hier, 14 janvier, ajout de 180 pages, aujourd'hui le 15 google les a deja prises
secteur concurentiel aussi et toujours meme technique ( sans aucune chose interdite, je precise), meme constat que le deuxieme site, les requetes avec moins de 50000 resultats sortent, les autres non
un constat flagrant, la méthode de référencement étant strictement la meme , aucun site n'a plus de bls que les autres, le secteur est le meme, seul le critere age les distingue
moralité: vive les vieux bébés et laissons grandir les autres
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Une théorie sur cet effet sandbox
- Google sort l'API AdWords Sandbox
- L'effet sandbox sur Google
- Une théorie sur la Sandbox de Google
- Mon site est-il dans la SandBox ? Guide pratique...
- Le Sandbox serait-il lié au TrustRank ?
- Séminaire de formation au référencement à Paris et Toulouse
- Formation au référencement naturel : séminaires Ranking Metrics
- Séminaire de référencement à Toulouse avec Olivier Duffez
- Formation référencement Google à Paris le 29 mai
Consultez la description détaillée des produits ou services de Google suivants : Google Sandbox
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités





le forum