Les serveurs de Google seraient pleins ?

Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics


KOogar
WRInaute accro
WRInaute accro
 
Messages: 3974
Inscription: 16 Nov 2004

Les serveurs de Google seraient pleins ?

Message le Lun Mai 08, 2006 4:21

Bonjour,

http://www.theregister.co.uk/2006/05/04/google_bigdaddy_chaos/

Those machines are full !!! => Les ordis sont pleins !!! ( *Google en a 200 000)

Pour résumer; cet article nous dit que BigDaddy semble ne plus crawler le web depuis des semaines et remonter les pages ayant du contenu. Perso le dernier site que j'ai lancer le prouve car il n'est absolument pas crawler. De plus l'article nous dit que cela est confirmé par l'un des ingenieurs de Google. Affaire à suivre...



¨


TOMHTML
WRInaute accro
WRInaute accro
 
Messages: 3250
Inscription: 25 Aoû 2004

Message le Lun Mai 08, 2006 7:11

Eric Schmidt, PDG de Google, a écrit:We have a huge machine crisis

j'en parlais .

en effet les serveurs de google ne sont pas si illimités que ça ^^ voila qui d'un coup limite beaucoup de leurs plans ;)


yazerty
WRInaute passionné
WRInaute passionné
 
Messages: 1682
Inscription: 19 Juin 2005

Message le Lun Mai 08, 2006 7:40

... ou augmente leur plan d'achat de stockage ;-).

S'ils ont 200 000 machines, il leur suffit d'1 machine supplémentaire pour réindexer mes sites comme avant, non :D :lol: ;-).

pene-r
WRInaute passionné
WRInaute passionné
 
Messages: 1169
Inscription: 12 Jan 2005

Message le Lun Mai 08, 2006 8:02

Ouep,
Moi j'ai un peu de mal à croire qu'une usine à indexer n'anticipe pas l'espace disponible sur ses machines.... :?
ça fait encore parler de google en tous cas


OTP
Modérateur
Modérateur
 
Messages: 19532
Inscription: 16 Déc 2005

Message le Lun Mai 08, 2006 8:05

pene-r a écrit:Ouep,
Moi j'ai un peu de mal à croire qu'une usine à indexer n'anticipe pas l'espace disponible sur ses machines.... :?
ça fait encore parler de google en tous cas


+1
Comme si Renault se pointait à un GP de Formule 1 sans carburant pour ses voitures...


serval2a
WRInaute accro
WRInaute accro
 
Messages: 3457
Inscription: 21 Mar 2005

Message le Lun Mai 08, 2006 9:16

Bonjour,

Mes sites sont crawlés régulièrement, même si la fréquence est faible.
Toutefois le nombre de pages indexées diminue sur la plupart même si il augmente pour d'autres.

billyboylindien
WRInaute impliqué
WRInaute impliqué
 
Messages: 578
Inscription: 28 Fév 2005

Message le Lun Mai 08, 2006 9:25

Moi j'ai un site completement absent de l'index lacé depuis 1 mois et demi :s


HawkEye
WRInaute accro
WRInaute accro
 
Messages: 17013
Inscription: 23 Fév 2004

Message le Lun Mai 08, 2006 9:42

La logique voudrait que la réaction immédiate soit une plus forte répression de la fraude (blacklist), et plus de sévérité sur la duplication de contenu (duplicate content), non ?


Szarah
WRInaute accro
WRInaute accro
 
Messages: 8093
Inscription: 22 Fév 2006

Message le Lun Mai 08, 2006 9:49

Sur le duplicate, ce serait logique puisque justifié par la nécessité. Mais ça reste flou pour les webmasters, le duplicate, Zimounet le rappelait encore il y a peu de temps.

Sur le blacklistage, peut-être que ce serait l'occasion de justifier plus de sévérité, oui.

Mais il y a plus à faire, peut-être : liquider les caches après s'être posé la question de leur réelle utilisation.

billyboylindien
WRInaute impliqué
WRInaute impliqué
 
Messages: 578
Inscription: 28 Fév 2005

Message le Lun Mai 08, 2006 9:51

et par la même se faire dela mauvaise pub qui viendrait étayer les rumeures sur leurs difficultées :s

unpassant
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 476
Inscription: 15 Fév 2005

Message le Lun Mai 08, 2006 9:56

Ceci expliquerai quand même les problèmes que pas mal de webmaster ont.
Mais je trouve aussi bizard que google n'a pas prévu un éventuelle problème de stockage, avant de changer un algo on pense quand même a ca en premier...


Szarah
WRInaute accro
WRInaute accro
 
Messages: 8093
Inscription: 22 Fév 2006

Message le Lun Mai 08, 2006 10:01

L'explication est peut-être très simple :
- multiplication des index à cause de l'utilisation concurrente de différents robots;
- problèmes inattendus dans la concaténation de ces index en un seul;
- d'où engorgement rapide.

La solution : tout arrêter le temps de concaténer proprement.
Et c'est ce qui a l'air de se produire, non ?


HawkEye
WRInaute accro
WRInaute accro
 
Messages: 17013
Inscription: 23 Fév 2004

Message le Lun Mai 08, 2006 10:09

Il se peut que ça fasse simplement partie de la stratégie...

Google a joué à "c'est moi k'a la plus grosse" aveec Yahoo... Peut-être tient-il à présent compte des réponses du style "mieux vaut une p'tite travailleuse que...".

En gros, il se peut que Google redéfinisse doucement sa politique d'expansion sauvage pour s'orienter vers plus de qualité, réduisant de ce fait la dimension de son index en en retirant le contenu qui serait:

- illégal / dangereux (drogue/pédo/etc...)
- obsolète (404,domaines expirés,...)
- inutile (duplication de contenu, spamdexing,...)

Comme le dit Szarah, la "limite" de la duplication de contenu semble floue (certains disent 80% de similarité (mais, de contenu, de code, de texte, de quoi? on ne sait effectivement pas...).

Ce qui est certain en revanche, c'est que ceux qui dupliquent savent qu'ils dupliquent.

Un simple exemple: l'indexation des pages "basse-qualité" des forums (c'est IPB je pense?), retourne plus de 6 illions de pages (par nature "dupliquées"), et je ne parle que de ceux qui ont conservé "/lofiversion/" comme règlage :D

Je suis partisan du nettoyage !

unpassant
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 476
Inscription: 15 Fév 2005

Message le Lun Mai 08, 2006 10:18

Si il veulent arreter de jouer a qui a la plus grosse, la premiere chose a faire est d'arreter de gonfler le nombre de page indexer sur un site, pour moi c'est x10...

Je suis aussi partisant du nettoyage, mais pour les forums je ne suis pas d'accord, sachant que lors de recherche ont trouve souvent plus de reponses positive sur les forums.


Szarah
WRInaute accro
WRInaute accro
 
Messages: 8093
Inscription: 22 Fév 2006

Message le Lun Mai 08, 2006 10:21

En ce qui concerne les 404, je peux témoigner d'un effort particulier de Google :
- rapport sur un sitemap d'un URL en problème HTTP;
- cette page n'existe plus depuis longtemps, n'existe pas en cache, n'a jamais fait partie d'aucune sitemap;
- l'unique référence à cette page se trouve sur un forum américain;
- donc : Google fait un boulot minutieux à ce niveau-là, il aide à nettoyer.

Les serveurs de Google seraient pleins ?

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par les experts Google Analytics de Ranking Metrics.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité