recherche de sujet de memoire

Nouveau WRInaute
bonjour,
je suis étudiant finaliste en génie informatique mon domaine de recherche étant la programmation parallèle; je suis à la recherche d'un sujet sur le referencement et les moteurs de recherche basé surtout sur le "nutch" et je compte sur tout le monde pour m'aider à enrichir mes connaissance dans ce domaine.
 
WRInaute passionné
Et l'amabilité tu connais jibi ;-)

A propos de Nutch

Le projet Nutch a pour but le développement d'un moteur de recherche open source pour le web.

Bien que les moteurs de recherche soient indispensables pour naviguer sur Internet, leur nombre est en diminution. Ce qui aujourd'hui est un oligopole pourrait se changer rapidement en monopole, où une seule entreprise contrôlerait presque toute la recherche sur le web pour son profit commercial. Cela ne serait pas bon pour les utilisateurs d'Internet.

Nutch constitue une alternative transparente aux moteurs de recherche commerciaux. Seuls les résultats d'un système de recherche open source peuvent être garantis comme n'étant pas faussés (ou du moins le biais serait publique). Tous les principaux moteurs de recherche ont des formules de classement propriétaires et n'expliqueront jamais pourquoi telle ou telle page a été classée d'une certaine façon. De plus, certains moteurs de recherche choisissent les sites à indexer en échange d'une rémunération plus que sur la valeur intrinsèque du site. Nutch, lui, n'a rien à cacher et n'a aucune raison de fausser ses résultats ou son crawling si ce n'est pour donner à chaque utilisateur les meilleurs résultats possibles.

Nutch a pour but de permettre à quiconque de mettre en place un moteur de recherche web facilement et à moindre frais. Ce n'est pas une mince affaire. Pour y parvenir, le logiciel Nutch doit être capable de :

* récupérer plusieurs milliards de pages par mois
* maintenir un index de ces pages
* faire des recherches sur cet index jusqu'à un millier de fois par seconde
* offrir des résultats de très haute qualité
* fonctionner à moindre coût

Source : -http://lucene.apache.org/nutch/docs/fr/
 
WRInaute accro
- Comparaison des classifications entre technologies de moteurs
- Réalisation d'une interface graphique de gestion de Nutch
- Evaluation des performances de Nutch
- ...

Si tu te lances dans ce genre de sujet, je suis intéressé de suivre de loin et d'échanger de l'info.
 
WRInaute passionné
Personellement, je ne crois pas à un algoithme de moteur de recherche qui serait public.
Du fait même de l'existence de stratégries de référencement, les résultats seraient faussés. Je m'explique.

Si l'algorithme est public, il existe alors une solution connue de tous maximisant le positionnement d'un site.
Même si tous les critères de positionnement ne sont pas maîtrisables (quoique) il y a là un paradoxe : un algorithme de classement ne peut pas être public.
 
WRInaute accro
MagicYoyo a dit:
Personellement, je ne crois pas à un algoithme de moteur de recherche qui serait public.
Du fait même de l'existence de stratégries de référencement, les résultats seraient faussés. Je m'explique.

Si l'algorithme est public, il existe alors une solution connue de tous maximisant le positionnement d'un site.
Même si tous les critères de positionnement ne sont pas maîtrisables (quoique) il y a là un paradoxe : un algorithme de classement ne peut pas être public.

Autre sujet :
Evaluation de la robustesse de l'algorithme de classement de Nutch
 
Discussions similaires
Haut