Règles du forum

Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !

Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).

Messages: 1

Enregistré le: 26 Sep 2005

Message le Lun Sep 26, 2005 9:44

bonjour,
je suis étudiant finaliste en génie informatique mon domaine de recherche étant la programmation parallèle; je suis à la recherche d'un sujet sur le referencement et les moteurs de recherche basé surtout sur le "nutch" et je compte sur tout le monde pour m'aider à enrichir mes connaissance dans ce domaine.
Haut
7 Réponses
Messages: 1147

Enregistré le: 7 Nov 2003

Message le Lun Sep 26, 2005 10:29

Peux-tu nous rappeler la définition de "nutch" s'il-te-plaît Guylulu??
Haut
Messages: 322

Enregistré le: 18 Aoû 2003

Message le Lun Sep 26, 2005 10:34

et define:......, tu connais ?
http://www.google.com/search?client=firefox-a&rls=org.mozilla%3Afr-FR%3Aofficial_s&hl=fr&q=define%3Anutch&lr=&btnG=Recherche+Google
Haut
Messages: 1712

Enregistré le: 5 Juil 2004

Message le Lun Sep 26, 2005 13:50

Et l'amabilité tu connais jibi ;-)

A propos de Nutch

Le projet Nutch a pour but le développement d'un moteur de recherche open source pour le web.

Bien que les moteurs de recherche soient indispensables pour naviguer sur Internet, leur nombre est en diminution. Ce qui aujourd'hui est un oligopole pourrait se changer rapidement en monopole, où une seule entreprise contrôlerait presque toute la recherche sur le web pour son profit commercial. Cela ne serait pas bon pour les utilisateurs d'Internet.

Nutch constitue une alternative transparente aux moteurs de recherche commerciaux. Seuls les résultats d'un système de recherche open source peuvent être garantis comme n'étant pas faussés (ou du moins le biais serait publique). Tous les principaux moteurs de recherche ont des formules de classement propriétaires et n'expliqueront jamais pourquoi telle ou telle page a été classée d'une certaine façon. De plus, certains moteurs de recherche choisissent les sites à indexer en échange d'une rémunération plus que sur la valeur intrinsèque du site. Nutch, lui, n'a rien à cacher et n'a aucune raison de fausser ses résultats ou son crawling si ce n'est pour donner à chaque utilisateur les meilleurs résultats possibles.

Nutch a pour but de permettre à quiconque de mettre en place un moteur de recherche web facilement et à moindre frais. Ce n'est pas une mince affaire. Pour y parvenir, le logiciel Nutch doit être capable de :

* récupérer plusieurs milliards de pages par mois
* maintenir un index de ces pages
* faire des recherches sur cet index jusqu'à un millier de fois par seconde
* offrir des résultats de très haute qualité
* fonctionner à moindre coût



Source : -http://lucene.apache.org/nutch/docs/fr/
Haut
Messages: 3605

Enregistré le: 10 Fév 2004

Message le Lun Sep 26, 2005 13:54

C'est un cursus en Bac + combien (histoire que je puisse me faire une idée du type de travail) ?
Tu es en quelle année ?
Modifié en dernier par ecocentric le Lun Sep 26, 2005 14:02, modifié 1 fois.
Haut
Messages: 3605

Enregistré le: 10 Fév 2004

Message le Lun Sep 26, 2005 13:57

- Comparaison des classifications entre technologies de moteurs
- Réalisation d'une interface graphique de gestion de Nutch
- Evaluation des performances de Nutch
- ...

Si tu te lances dans ce genre de sujet, je suis intéressé de suivre de loin et d'échanger de l'info.
Haut
Messages: 2877

Enregistré le: 24 Mai 2004

Message le Lun Sep 26, 2005 14:35

Personellement, je ne crois pas à un algoithme de moteur de recherche qui serait public.
Du fait même de l'existence de stratégries de référencement, les résultats seraient faussés. Je m'explique.

Si l'algorithme est public, il existe alors une solution connue de tous maximisant le positionnement d'un site.
Même si tous les critères de positionnement ne sont pas maîtrisables (quoique) il y a là un paradoxe : un algorithme de classement ne peut pas être public.
Haut
Messages: 3605

Enregistré le: 10 Fév 2004

Message le Lun Sep 26, 2005 15:02

MagicYoyo a écrit:Personellement, je ne crois pas à un algoithme de moteur de recherche qui serait public.
Du fait même de l'existence de stratégries de référencement, les résultats seraient faussés. Je m'explique.

Si l'algorithme est public, il existe alors une solution connue de tous maximisant le positionnement d'un site.
Même si tous les critères de positionnement ne sont pas maîtrisables (quoique) il y a là un paradoxe : un algorithme de classement ne peut pas être public.


Autre sujet :
Evaluation de la robustesse de l'algorithme de classement de Nutch
Haut