Les serveurs de Google seraient pleins ?

Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics


KOogar
WRInaute accro
WRInaute accro
 
Messages: 3324
Inscription: Mar Nov 16, 2004 18:27

Les serveurs de Google seraient pleins ?

Message le Lun Mai 08, 2006 4:21

Bonjour,

http://www.theregister.co.uk/2006/05/04/google_bigdaddy_chaos/

Those machines are full !!! => Les ordis sont pleins !!! ( *Google en a 200 000)

Pour résumer; cet article nous dit que BigDaddy semble ne plus crawler le web depuis des semaines et remonter les pages ayant du contenu. Perso le dernier site que j'ai lancer le prouve car il n'est absolument pas crawler. De plus l'article nous dit que cela est confirmé par l'un des ingenieurs de Google. Affaire à suivre...



¨


TOMHTML
WRInaute accro
WRInaute accro
 
Messages: 3243
Inscription: Mer Aoû 25, 2004 14:05

Message le Lun Mai 08, 2006 7:11

Eric Schmidt, PDG de Google, a écrit:We have a huge machine crisis

j'en parlais .

en effet les serveurs de google ne sont pas si illimités que ça ^^ voila qui d'un coup limite beaucoup de leurs plans ;)


yazerty
WRInaute accro
WRInaute accro
 
Messages: 1682
Inscription: Dim Juin 19, 2005 19:47

Message le Lun Mai 08, 2006 7:40

... ou augmente leur plan d'achat de stockage ;-).

S'ils ont 200 000 machines, il leur suffit d'1 machine supplémentaire pour réindexer mes sites comme avant, non :D :lol: ;-).

pene-r
WRInaute accro
WRInaute accro
 
Messages: 1169
Inscription: Mer Jan 12, 2005 9:26

Message le Lun Mai 08, 2006 8:02

Ouep,
Moi j'ai un peu de mal à croire qu'une usine à indexer n'anticipe pas l'espace disponible sur ses machines.... :?
ça fait encore parler de google en tous cas


OTP
Modérateur
Modérateur
 
Messages: 12917
Inscription: Ven Déc 16, 2005 22:41

Message le Lun Mai 08, 2006 8:05

pene-r a écrit:Ouep,
Moi j'ai un peu de mal à croire qu'une usine à indexer n'anticipe pas l'espace disponible sur ses machines.... :?
ça fait encore parler de google en tous cas


+1
Comme si Renault se pointait à un GP de Formule 1 sans carburant pour ses voitures...


serval2a
WRInaute accro
WRInaute accro
 
Messages: 3453
Inscription: Lun Mar 21, 2005 18:17

Message le Lun Mai 08, 2006 9:16

Bonjour,

Mes sites sont crawlés régulièrement, même si la fréquence est faible.
Toutefois le nombre de pages indexées diminue sur la plupart même si il augmente pour d'autres.

billyboylindien
WRInaute passionné
WRInaute passionné
 
Messages: 578
Inscription: Lun Fév 28, 2005 22:25

Message le Lun Mai 08, 2006 9:25

Moi j'ai un site completement absent de l'index lacé depuis 1 mois et demi :s


HawkEye
Modérateur
Modérateur
 
Messages: 15029
Inscription: Lun Fév 23, 2004 12:33

Message le Lun Mai 08, 2006 9:42

La logique voudrait que la réaction immédiate soit une plus forte répression de la fraude (blacklist), et plus de sévérité sur la duplication de contenu (duplicate content), non ?


Szarah
WRInaute accro
WRInaute accro
 
Messages: 8090
Inscription: Mer Fév 22, 2006 18:24

Message le Lun Mai 08, 2006 9:49

Sur le duplicate, ce serait logique puisque justifié par la nécessité. Mais ça reste flou pour les webmasters, le duplicate, Zimounet le rappelait encore il y a peu de temps.

Sur le blacklistage, peut-être que ce serait l'occasion de justifier plus de sévérité, oui.

Mais il y a plus à faire, peut-être : liquider les caches après s'être posé la question de leur réelle utilisation.

billyboylindien
WRInaute passionné
WRInaute passionné
 
Messages: 578
Inscription: Lun Fév 28, 2005 22:25

Message le Lun Mai 08, 2006 9:51

et par la même se faire dela mauvaise pub qui viendrait étayer les rumeures sur leurs difficultées :s

unpassant
WRInaute impliqué
WRInaute impliqué
 
Messages: 475
Inscription: Mar Fév 15, 2005 17:25

Message le Lun Mai 08, 2006 9:56

Ceci expliquerai quand même les problèmes que pas mal de webmaster ont.
Mais je trouve aussi bizard que google n'a pas prévu un éventuelle problème de stockage, avant de changer un algo on pense quand même a ca en premier...


Szarah
WRInaute accro
WRInaute accro
 
Messages: 8090
Inscription: Mer Fév 22, 2006 18:24

Message le Lun Mai 08, 2006 10:01

L'explication est peut-être très simple :
- multiplication des index à cause de l'utilisation concurrente de différents robots;
- problèmes inattendus dans la concaténation de ces index en un seul;
- d'où engorgement rapide.

La solution : tout arrêter le temps de concaténer proprement.
Et c'est ce qui a l'air de se produire, non ?


HawkEye
Modérateur
Modérateur
 
Messages: 15029
Inscription: Lun Fév 23, 2004 12:33

Message le Lun Mai 08, 2006 10:09

Il se peut que ça fasse simplement partie de la stratégie...

Google a joué à "c'est moi k'a la plus grosse" aveec Yahoo... Peut-être tient-il à présent compte des réponses du style "mieux vaut une p'tite travailleuse que...".

En gros, il se peut que Google redéfinisse doucement sa politique d'expansion sauvage pour s'orienter vers plus de qualité, réduisant de ce fait la dimension de son index en en retirant le contenu qui serait:

- illégal / dangereux (drogue/pédo/etc...)
- obsolète (404,domaines expirés,...)
- inutile (duplication de contenu, spamdexing,...)

Comme le dit Szarah, la "limite" de la duplication de contenu semble floue (certains disent 80% de similarité (mais, de contenu, de code, de texte, de quoi? on ne sait effectivement pas...).

Ce qui est certain en revanche, c'est que ceux qui dupliquent savent qu'ils dupliquent.

Un simple exemple: l'indexation des pages "basse-qualité" des forums (c'est IPB je pense?), retourne plus de 6 illions de pages (par nature "dupliquées"), et je ne parle que de ceux qui ont conservé "/lofiversion/" comme règlage :D

Je suis partisan du nettoyage !

unpassant
WRInaute impliqué
WRInaute impliqué
 
Messages: 475
Inscription: Mar Fév 15, 2005 17:25

Message le Lun Mai 08, 2006 10:18

Si il veulent arreter de jouer a qui a la plus grosse, la premiere chose a faire est d'arreter de gonfler le nombre de page indexer sur un site, pour moi c'est x10...

Je suis aussi partisant du nettoyage, mais pour les forums je ne suis pas d'accord, sachant que lors de recherche ont trouve souvent plus de reponses positive sur les forums.


Szarah
WRInaute accro
WRInaute accro
 
Messages: 8090
Inscription: Mer Fév 22, 2006 18:24

Message le Lun Mai 08, 2006 10:21

En ce qui concerne les 404, je peux témoigner d'un effort particulier de Google :
- rapport sur un sitemap d'un URL en problème HTTP;
- cette page n'existe plus depuis longtemps, n'existe pas en cache, n'a jamais fait partie d'aucune sitemap;
- l'unique référence à cette page se trouve sur un forum américain;
- donc : Google fait un boulot minutieux à ce niveau-là, il aide à nettoyer.

Les serveurs de Google seraient pleins ?

Formation recommandée sur ce thème :

Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par Julien Coquet, expert certifié officiellement par Google Analytics.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités