Les serveurs de Google seraient pleins ?
27 messages
• Page 1 sur 2 • 1, 2
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
-

KOogar - WRInaute accro

- Messages: 3974
- Inscription: 16 Nov 2004
Les serveurs de Google seraient pleins ?
Bonjour,
http://www.theregister.co.uk/2006/05/04/google_bigdaddy_chaos/
Those machines are full !!! => Les ordis sont pleins !!! ( *Google en a 200 000)
Pour résumer; cet article nous dit que BigDaddy semble ne plus crawler le web depuis des semaines et remonter les pages ayant du contenu. Perso le dernier site que j'ai lancer le prouve car il n'est absolument pas crawler. De plus l'article nous dit que cela est confirmé par l'un des ingenieurs de Google. Affaire à suivre...
¨
http://www.theregister.co.uk/2006/05/04/google_bigdaddy_chaos/
Those machines are full !!! => Les ordis sont pleins !!! ( *Google en a 200 000)
Pour résumer; cet article nous dit que BigDaddy semble ne plus crawler le web depuis des semaines et remonter les pages ayant du contenu. Perso le dernier site que j'ai lancer le prouve car il n'est absolument pas crawler. De plus l'article nous dit que cela est confirmé par l'un des ingenieurs de Google. Affaire à suivre...
¨
-

OTP - Modérateur

- Messages: 19532
- Inscription: 16 Déc 2005
pene-r a écrit:Ouep,
Moi j'ai un peu de mal à croire qu'une usine à indexer n'anticipe pas l'espace disponible sur ses machines....![]()
ça fait encore parler de google en tous cas
+1
Comme si Renault se pointait à un GP de Formule 1 sans carburant pour ses voitures...
- billyboylindien
- WRInaute impliqué

- Messages: 578
- Inscription: 28 Fév 2005
Moi j'ai un site completement absent de l'index lacé depuis 1 mois et demi :s
-

Szarah - WRInaute accro

- Messages: 8093
- Inscription: 22 Fév 2006
Sur le duplicate, ce serait logique puisque justifié par la nécessité. Mais ça reste flou pour les webmasters, le duplicate, Zimounet le rappelait encore il y a peu de temps.
Sur le blacklistage, peut-être que ce serait l'occasion de justifier plus de sévérité, oui.
Mais il y a plus à faire, peut-être : liquider les caches après s'être posé la question de leur réelle utilisation.
Sur le blacklistage, peut-être que ce serait l'occasion de justifier plus de sévérité, oui.
Mais il y a plus à faire, peut-être : liquider les caches après s'être posé la question de leur réelle utilisation.
- billyboylindien
- WRInaute impliqué

- Messages: 578
- Inscription: 28 Fév 2005
et par la même se faire dela mauvaise pub qui viendrait étayer les rumeures sur leurs difficultées :s
-

Szarah - WRInaute accro

- Messages: 8093
- Inscription: 22 Fév 2006
L'explication est peut-être très simple :
- multiplication des index à cause de l'utilisation concurrente de différents robots;
- problèmes inattendus dans la concaténation de ces index en un seul;
- d'où engorgement rapide.
La solution : tout arrêter le temps de concaténer proprement.
Et c'est ce qui a l'air de se produire, non ?
- multiplication des index à cause de l'utilisation concurrente de différents robots;
- problèmes inattendus dans la concaténation de ces index en un seul;
- d'où engorgement rapide.
La solution : tout arrêter le temps de concaténer proprement.
Et c'est ce qui a l'air de se produire, non ?
-

HawkEye - WRInaute accro

- Messages: 17013
- Inscription: 23 Fév 2004
Il se peut que ça fasse simplement partie de la stratégie...
Google a joué à "c'est moi k'a la plus grosse" aveec Yahoo... Peut-être tient-il à présent compte des réponses du style "mieux vaut une p'tite travailleuse que...".
En gros, il se peut que Google redéfinisse doucement sa politique d'expansion sauvage pour s'orienter vers plus de qualité, réduisant de ce fait la dimension de son index en en retirant le contenu qui serait:
- illégal / dangereux (drogue/pédo/etc...)
- obsolète (404,domaines expirés,...)
- inutile (duplication de contenu, spamdexing,...)
Comme le dit Szarah, la "limite" de la duplication de contenu semble floue (certains disent 80% de similarité (mais, de contenu, de code, de texte, de quoi? on ne sait effectivement pas...).
Ce qui est certain en revanche, c'est que ceux qui dupliquent savent qu'ils dupliquent.
Un simple exemple: l'indexation des pages "basse-qualité" des forums (c'est IPB je pense?), retourne plus de 6 illions de pages (par nature "dupliquées"), et je ne parle que de ceux qui ont conservé "/lofiversion/" comme règlage
Je suis partisan du nettoyage !
Google a joué à "c'est moi k'a la plus grosse" aveec Yahoo... Peut-être tient-il à présent compte des réponses du style "mieux vaut une p'tite travailleuse que...".
En gros, il se peut que Google redéfinisse doucement sa politique d'expansion sauvage pour s'orienter vers plus de qualité, réduisant de ce fait la dimension de son index en en retirant le contenu qui serait:
- illégal / dangereux (drogue/pédo/etc...)
- obsolète (404,domaines expirés,...)
- inutile (duplication de contenu, spamdexing,...)
Comme le dit Szarah, la "limite" de la duplication de contenu semble floue (certains disent 80% de similarité (mais, de contenu, de code, de texte, de quoi? on ne sait effectivement pas...).
Ce qui est certain en revanche, c'est que ceux qui dupliquent savent qu'ils dupliquent.
Un simple exemple: l'indexation des pages "basse-qualité" des forums (c'est IPB je pense?), retourne plus de 6 illions de pages (par nature "dupliquées"), et je ne parle que de ceux qui ont conservé "/lofiversion/" comme règlage
Je suis partisan du nettoyage !
- unpassant
- WRInaute occasionnel

- Messages: 476
- Inscription: 15 Fév 2005
Si il veulent arreter de jouer a qui a la plus grosse, la premiere chose a faire est d'arreter de gonfler le nombre de page indexer sur un site, pour moi c'est x10...
Je suis aussi partisant du nettoyage, mais pour les forums je ne suis pas d'accord, sachant que lors de recherche ont trouve souvent plus de reponses positive sur les forums.
Je suis aussi partisant du nettoyage, mais pour les forums je ne suis pas d'accord, sachant que lors de recherche ont trouve souvent plus de reponses positive sur les forums.
-

Szarah - WRInaute accro

- Messages: 8093
- Inscription: 22 Fév 2006
En ce qui concerne les 404, je peux témoigner d'un effort particulier de Google :
- rapport sur un sitemap d'un URL en problème HTTP;
- cette page n'existe plus depuis longtemps, n'existe pas en cache, n'a jamais fait partie d'aucune sitemap;
- l'unique référence à cette page se trouve sur un forum américain;
- donc : Google fait un boulot minutieux à ce niveau-là, il aide à nettoyer.
- rapport sur un sitemap d'un URL en problème HTTP;
- cette page n'existe plus depuis longtemps, n'existe pas en cache, n'a jamais fait partie d'aucune sitemap;
- l'unique référence à cette page se trouve sur un forum américain;
- donc : Google fait un boulot minutieux à ce niveau-là, il aide à nettoyer.
27 messages
• Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par les experts Google Analytics de Ranking Metrics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Google et les serveurs d'hébergement
- Google et les Serveurs Downs !
- Les datacenters de Google ET serveurs
- Les serveurs de Google à Dublin ?
- jQuery depuis les serveurs de Google
- Les serveurs pour Google Actualités
- Problème sur les serveurs de google ?
- + de 2 millions de serveurs dans les datacenters Google ?
- Réplication des données entre les serveurs Google....
- Délai de mise à jour de tous les serveurs google ?
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité




