Quelle est la base de données utilisée par Google ?

WRInaute passionné
Google n'utilise pas une base de donnée au sens SGBDR du terme ( mySql, PotsgreSQL, Oracle, etc... ).

Il utilise un inverted index. Pour faire très simple et très schématique, il dispose d'un index qui est un peu l'équivalent des index que tu trouves à la fin d'un livre.
Il distribue son index sur un système de fichier distribué que l'on nomme GFS ( Google File System ) à l'aide d'un algo : map-reduce.

Doug Dutting essaye de faire une implémentation Open Source d'une solution de recherche qui pourrait être comparable à Google.
Se projet est porté par la fondation Apache sous le nom Lucene.
Se projet se décompose aujourd'hui en trois sous-partie :
- Lucene : l'indexeur
- Nutch : un crawler qui intégre Lucène comme indexeur
- Depuis peu Hadoop : qui est un portage Open Source de l'algo map-reduce

Si tu veux en savoir plus sur la structure d'in index Lucene :
http://www-igm.univ-mlv.fr/~dr/XPOSE2003/lucene/
 
Discussions similaires
Haut