Le bidonnage du comptage Google.

Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics


anamorph
Nouveau WRInaute
 
Messages: 38
Inscription: Ven Déc 17, 2004 15:41

Le bidonnage du comptage Google.

Message le Ven Jan 28, 2005 11:44

Voilà un article intéressant sur les problèmes de calculs chez Google, à voir sur ce blog spécialisé dans les technologies du langage :

http://aixtal.blogspot.com/2005/01/web- ... oogle.html


fredwat
WRInaute accro
WRInaute accro
 
Messages: 3182
Inscription: Mer Fév 11, 2004 19:46

Message le Ven Jan 28, 2005 12:01

Pour rebondir la dessus
j'ai constaté qu'avant la fin de l'année passée et jusqu' à il y a environ une semaine les résultats avaient été "optimisés"
exemple sur ma requête favorite: jusqu'à 180 000 résultats
depuis quelques jours, donc, les chiffres reviennent à la version précédente
169 000 résultats.
Je suppose ne pas être le seul à l'avoir remarqué :!:
l'effet d'annonce de la sortie du moteur "Msn" sûrement


berberber
WRInaute passionné
WRInaute passionné
 
Messages: 647
Inscription: Lun Mai 26, 2003 8:49

Message le Ven Jan 28, 2005 12:09

exemple sur ma requête favorite: jusqu'à 180 000 résultats
depuis quelques jours, donc, les chiffres reviennent à la version précédente
169 000 résultats.


ou alors seulement deux data centers differents.


fredwat
WRInaute accro
WRInaute accro
 
Messages: 3182
Inscription: Mer Fév 11, 2004 19:46

Message le Ven Jan 28, 2005 12:15

entre 8 000 et 12 000 résultats de moins qu'il y a 8 jours
(variations vérifiées sur tous les DT)
:wink:

squawk
WRInaute accro
WRInaute accro
 
Messages: 5985
Inscription: Lun Mar 22, 2004 19:45

Message le Ven Jan 28, 2005 12:22

Le mec qui a étudié ça a vraiment rien à foutre :lol:

Les erreurs viennent tout simplement que c'est des estimations et que pour certains résultats ça part un peu en live mais quelle importance....

En tous cas pour The c'est mieux qu'avant car ils affichent 8000000000, à l'époque des 4 milliards de pages dans l'index, ils affichaient plus de pages contenant "the" que de pages web :D


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15818
Inscription: Ven Avr 19, 2002 19:51

Message le Ven Jan 28, 2005 12:51

squawk a écrit:Les erreurs viennent tout simplement que c'est des estimations et que pour certains résultats ça part un peu en live mais quelle importance....

justement son article montre que ce n'est pas lié aux seules approximations mais que c'est carrément n'importe quoi.
ou alors c'est simplement que la détermination de la langue des pages web fonctionne très mal (car cet article se base dessus)


turulillo
WRInaute passionné
WRInaute passionné
 
Messages: 631
Inscription: Ven Juin 27, 2003 17:36

Message le Ven Jan 28, 2005 13:03

squawk a écrit:Le mec qui a étudié ça a vraiment rien à foutre :lol:

Les erreurs viennent tout simplement que c'est des estimations et que pour certains résultats ça part un peu en live mais quelle importance....

En tous cas pour The c'est mieux qu'avant car ils affichent 8000000000, à l'époque des 4 milliards de pages dans l'index, ils affichaient plus de pages contenant "the" que de pages web :D


Lis l'artilce en entier avant de poster ce genre de commentaires.
Tout d'abord son étude est la plus pertinente que j'ai pu lire en français, ce type mérite à être connu et il pourrait apporter beaucoup à la communauté des référenceurs, un peu à la façon d'un Dr. Garcia sur SEW.
Ensuite, tu as peut être l'impression que ce n'est pas important, mais en fait ces "petits incidents" sont symptomatiques de problèmes beaucoup plus graves dans l'index de Google, voire même d'un "maquillage" de la taille réelle de l'index.
Je me permets de réitérer mon conseil: lis l'artilce en entier, il en vaut vraiment la peine.
Olivier, il faudrait peut être inviter Jean Véronis à participer au forum (si ce n'est pas déja le cas) ?...ça relèvrait le débat.

squawk
WRInaute accro
WRInaute accro
 
Messages: 5985
Inscription: Lun Mar 22, 2004 19:45

Message le Ven Jan 28, 2005 13:12

Ben le truc c'est que personne ne sait comment Google compte le nombre de résultats, c'est d'ailleurs la même chose avec la commande site: pour le nombre de pages par exemple...
Mais peut etre que toi, tu sais comment ça fonctionne ?

En tous cas le 8 milliards de résultats pour "The" il a plutot l'air de pas être le résultat d'un calcul vu qu'il change jamais.

D'ailleurs MSN a l'air de faire comme Google genre pour the :

total : 1-10 sur 181 530 249 résultats contenant the (0,11 secondes)
fr : 1-10 sur 5 202 815 425 résultats contenant the (0,12 secondes)

ou www :
1-10 sur 5 202 815 425 résultats contenant www (0,11 secondes)
1-10 sur 181 530 249 résultats contenant www (0,09 secondes)

3%

Ensuite, tu as peut être l'impression que ce n'est pas important, mais en fait ces "petits incidents" sont symptomatiques de problèmes beaucoup plus graves dans l'index de Google, voire même d'un "maquillage" de la taille réelle de l'index.


Peut etre que tu peux nous expliquez le rapport, sinon c'est pas la peine de prendre un ton comme tu le prends dans tes messages ça sert à rien :wink:

Stellvia
WRInaute impliqué
WRInaute impliqué
 
Messages: 413
Inscription: Mar Déc 28, 2004 0:02

Message le Ven Jan 28, 2005 13:33

Interessant , mais faut deja avoir un bon niveau en math pour tout comprendre.

PuraVida
WRInaute accro
WRInaute accro
 
Messages: 1007
Inscription: Mar Jan 13, 2004 19:36

Message le Ven Jan 28, 2005 13:41

WOW!!
Ca fait du bien de lire quelqu'un de serieux et aparament qui sait de quoi il parle :wink:
Duffez devrait le prendre comme partenaire :lol:
Et nous bin, faudras oublié nos petit GGGGG et lire Jean Véronis plus souvent!!!

Chose interressante: D'apres Jean Véronis, yahoo aurait un moteur + futé ou serieux..... Hum L'avenir nous promet d'etre interressant a découvrir le degré d'honneteté de certain "godengine"...

Grand merci a anamorph pour ce lien :!:


turulillo
WRInaute passionné
WRInaute passionné
 
Messages: 631
Inscription: Ven Juin 27, 2003 17:36

Message le Ven Jan 28, 2005 13:46

squawk a écrit:
Peut etre que tu peux nous expliquez le rapport, sinon c'est pas la peine de prendre un ton comme tu le prends dans tes messages ça sert à rien :wink:


Je n'ai pas dit que je savais et que toi tu ne savais pas...
Je n'ai rien à t'expliquer, tout est écrit dans cet article dont l'URL a été donné par anamorph.
Lis donc l'article et nous pourrons peut être en débattre.
Si tu as du temps et l'envie; lis les autres articles cités par l'auteur.
Sinon laisse tomber, c'est pas bien grave...

squawk
WRInaute accro
WRInaute accro
 
Messages: 5985
Inscription: Lun Mar 22, 2004 19:45

Message le Ven Jan 28, 2005 14:29

J'ai lu l'article, c'est marrant et intéressant mais je dis que ça n'a pas beaucoup d'intéret que Google fasse une erreur de calcul pour ce que je suppose etre une erreur de divergence quelconque dans un algorythme, c'était juste un commentaire de qqun qui est juste curieux et pas un spécialiste des se comme toi (mon job c'est l'aéronautique donc bon :wink: ).

Maintenant tu postes dans le topic pour me dire avec ton ton arrogant que je devrais lire l'article... mais je vois pas la moindre explication dans cet article, peut etre que tu peux nous expliquer pourquoi c'est pas anodin pour un moteur (je suis sur que y'a pleins d'autres gens intéressés), mais si tu préfères dédaigner les abrutis qui n'ont pas toute ta science dans ce domaine, c'est pas bien grave comme tu dis.... :roll:


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15818
Inscription: Ven Avr 19, 2002 19:51

Message le Ven Jan 28, 2005 14:41

je propose de rester dans le sujet et j'invite ceux qui souhaitent s'entretuer à le faire par MP interposés... ou de se calmer !


ocsima
WRInaute passionné
WRInaute passionné
 
Messages: 601
Inscription: Sam Sep 04, 2004 14:13

Message le Ven Jan 28, 2005 15:20

décroissance extrêmement rapide de la proportion des pages en anglais contenant une forme donnée quand la fréquence de cette forme augmente

J'en déduis que les anglais font beaucoup de fautes de frappes sur les mots courants. :lol:


turulillo
WRInaute passionné
WRInaute passionné
 
Messages: 631
Inscription: Ven Juin 27, 2003 17:36

Message le Ven Jan 28, 2005 15:56

Laisse tomber Squawk, je voulais pas être arrogant et je suis désolé si ce que j'ai écris a pu te donner cette impression.
Maintenant, je trouve que Jean Véronis est quelqu'un qui écrit des choses interessantes, qu'on a peu de gens comme lui en France, et que dire d'emblée sur un ton moqueur que "Le mec qui a étudié ça a vraiment rien à foutre " m'a, il est vrai, un peu énervé et que ça a du se ressentir dans mon post.
Sinon j'ai rien contre toi en particulier.
Sans rancune.

Le bidonnage du comptage Google.

Formation recommandée sur ce thème :

Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par Julien Coquet, expert certifié officiellement par Google Analytics.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités