base de données utilisée par Google ?

Nouveau WRInaute
Juste une question toute bête, Google utilise quelle base de données pour stocker toutes ces infos ? Oracle ? Je pense plutot qu'ils ont un système fait maison mais bon peut-être que je me trompe :wink:
 
WRInaute accro
Je crois que les limites de mysql dépendent du système.
De ce qu'il permet de gérer....

Mais je n'en suis pas certain.
 
WRInaute passionné
ce n'est pas tellement un pb de limite en terme de taille, mais plutot une limite en terme de performance.
Même sur un tout petit index, juste quelques millions de pages, la pluspart des SGBD se font retamer en terme de performances faces à des solutions d'indexation full-search comme google et autres.
 
WRInaute accro
spidetra a dit:
ce n'est pas tellement un pb de limite en terme de taille, mais plutot une limite en terme de performance.
Même sur un tout petit index, juste quelques millions de pages, la pluspart des SGBD se font retamer en terme de performances faces à des solutions d'indexation full-search comme google et autres.
Oui mais je ne pense pas que leur algo fonctionne avec un système de full-search.
Enfin pas sur la base de données du moins...
En effet une recherche se fait mais lorsque le robot passe sur la page.

Ensuite je pense que Google, gère bien différement sa base de données et ne contient pas tout le site (contenu).

EDIT: je précise un truc:
Oui en effet ils ont un cache.
Mais je ne pense pas qu'ils s'en servent au moment de la recherche de l'internaute. Tout est déjà calculé avant....
 
WRInaute passionné
thierry8 a dit:
Ensuite je pense que Google, gère bien différement sa base de données et ne contient pas tout le site (contenu).

Exact. La taille d'un index est bc plus petit que le contenu indexé.
De la m^me manière que l'index d'un livre est bc plus petit que le livre lui-même.
 
WRInaute accro
zimounet a dit:
d'apres moi, 90% du contenu d'une page est indexé par google, sinon comment ferions nous pour ressortir sur des mots clés placés en plein milieu du contenu?

Comment google pourrais ressortir l'extrait de la page qui correspond aux mot clé recherchés?
Comme dis plus haut, je pense que Google, à une analyse en amont.
Lors d'une recherche il ne fouille pas à nouveau dans tout le contenu.
En revanche, il est très facile de lié un contenu à un résultat.
L'un n'empêche pas l'autre...
 
WRInaute discret
Salut,
Question interessante, 6 ans déja et pas de réponse, et Google continue toujours à être le premier Moteur de recherche :) .

Bon, je sais pas moi non plus, cela m'intresserait de savoir, mais comme eux autres ont dit : c'est de la performance donc des algorithmes en plus de stockage (mots clés, contenus , etc ...) ;
 
WRInaute passionné
Google il doit utiliser son propre SGBD, vu qu'il developpe ses bot, son navigateurs, son systeme d'exploitation, son systeme de fichier, etc ...
Peut etre qu'au debut il a utiliser mysql, puis modifier mysql ( open source), au final, ce n'est pas le sgbd le plus important, mais le serveur, et ici google utilise surement un cluster d'ordi, donc logiquement une puissance ilimité, puisqu'ils peuvent rajouter autant d'ordi qu'ils veulent (et google n'est pas en manque d'argent).
 
Nouveau WRInaute
Pour tout ceux qui se perdent sur ce thread :

Google utilise le système BigTable basé sur le Google File System et c'est fait maison. C'est fait pour fonctionner sur plusieurs centaines ou milliers de machine !

Page wiki : http://fr.wikipedia.org/wiki/BigTable
Explication (in english) : http://fr.w3support.net/index.php?db=so&id=362956
 
Discussions similaires
Haut