Comment créer un moteur de recherche professionnel ?(Sérieu)

Nouveau WRInaute
Bonjour,
dans le cadre d'un projet professionnel j'aimerais créer un véritable moteur de recherche. Je ne m'attends pas à concurrencer google, mais au moins j'aimerais disposer d'un outil "sérieux", quelquechose de véritablement dédié à cette activité, écrit pour traiter rapidement beaucoup de requetes, etc. J'aimerais savoir où vous penser que je pourrais obtenir de telles informations, à savoir le langage à préferer etc.

Je ne mésestime pas la tache mais j'aimerais savoir où trouver des pistes de réflexion.

Cordialement
 
WRInaute impliqué
Salut,

Donc, tu possèdes déjà la base de données ou tu souhaites faire la recherche ?

Après, tout dépend ou est stocker tes informations, si c'est du MySQL, DB2, Oracle, MSSQL, etc..

Après, je pense la piste à prendre c'est sûrement le MATCHING afin d'avoir une information de pertinence.

A+
 
WRInaute occasionnel
Ouais, sans parler du coté robot d'indexation,
au niveau requete le MATCHING est le plus pertinent et recquiert une simplicité de mise en place.
Après je ne sais pas si MATCHING peut être considéré comme "serieux" car il y des limites assez importantes je trouve, mais c'est toujours mieux que les like '%%' mises en boucles tranqués par mot
 
WRInaute passionné
faut deja prevoir un gros budget pour la bande passante

et un autre pour le materiel

ensuite faut pondre des algoritmes de pertinence (un peu comme google)

rog
 
Nouveau WRInaute
Yep
merci pour les réponses.
En fait je pense plutot faire un moteur qui analyserais des sites soumis manuellement. Pas de crawler qui mouline en boucle !
Les matching, like tout ca je connais mais je me pose la question à savoir qu'est ce qu'ils utilisent dans les moteurs de recherche professionnel.
Quels langages.

CGI ? Java ???? Quoi d'autre ?
Sauriez vous un site où je peux trouver les solutions communément utilisées ?

Merci d'avance
 
WRInaute occasionnel
CGI ? Java ???? Quoi d'autre ?
Sauriez vous un site où je peux trouver les solutions communément utilisées ?

CGI n'est pas un langage, on fait des CGI en c, en perl, en shell, en java, etc...
Java, beurk pas assez performant
perl semblerait pas mal car très adapté au traitement de chaines de caracteres
et PHP pour l'interface :)
 
Nouveau WRInaute
:) ok
c vrai pour cgi petit lapsus lol

Bon ben je vais me renseigner sur PERL alors hum

Si ce n'est pas bon mon avocat te contactera :lol:
 
Discussions similaires
Haut