Nouveau moteur tout nouveau tout neuf tout lent tou bugué...

WRInaute discret
Bon j'avais fait mon poste puis j'ai tapé une touche trop fort et..disparu. Je recommence.

Voila quelques temps que je bosse sur un moteur de recherche, le voila en version beta dev privée pour wri

Les grandes lignes :

- priorité à l'indexation du contenu
- utilisation de mots-clefs et non pas de la totalité du contenu
- mon propre robots qui scan le web 24/24 (ou presque)
- affichage final des résultats aléatoire : pas de tri pagerankesque, tout site dont le contenu correspond à la requete à donc autant de chance qu'un autre.

Bug connu :
- manque de résultats : attente que le robots poursuivent son oeuvre
+ doublage du nombre des mots clefs (mais pas trop tout de meme !)
- doublons dans les résultats : bug identifié, script de correction pres a etre utiliser
- pas de description pour certains sites : en cours d'amélioration
- lenteur d'affichage : probleme connu et compris : solution trouvée en cours d'application (nécessite recompilage du kernel...avis aux amateurs)


Voila !
:wink:

Ytz


PS : j'oubliais : http://www.yumscan.com/ !! :D
 
WRInaute discret
Roh ... un moteur sans aucune pertinence, ça n'avait jamais été fait :)

Bon bref, je vois pas bien l'intérêt, mais t'as dû bien t'amuser.
 
WRInaute discret
Super :D
Non seulement sur mes requêtes je suis premier....
....mais en plus je suis tout seul :!: Plus de concurrence :D

Google devrait faire une 301 vers ton moteur...
 
WRInaute accro
Bh@Mp0 a dit:
Roh ... un moteur sans aucune pertinence, ça n'avait jamais été fait :)

Bon bref, je vois pas bien l'intérêt, mais t'as dû bien t'amuser.
L'inutile est beau ... parce qu'il est inutile :D
 
WRInaute occasionnel
Bh@Mp0 a dit:
Roh ... un moteur sans aucune pertinence, ça n'avait jamais été fait :)

Bon bref, je vois pas bien l'intérêt, mais t'as dû bien t'amuser.

Si moi je vois un intérêt : celui de savoir comment marche un moteur de recherche, quels algo utiliser, etc... Ca paut-être intéressant (bon je ne dis pas que moi j'en ferai un :lol: ) Mais c'est le seul intérêt.
 
WRInaute discret
gorchfock a dit:
Bh@Mp0 a dit:
Roh ... un moteur sans aucune pertinence, ça n'avait jamais été fait :)

Bon bref, je vois pas bien l'intérêt, mais t'as dû bien t'amuser.

Si moi je vois un intérêt : celui de savoir comment marche un moteur de recherche, quels algo utiliser, etc... Ca paut-être intéressant (bon je ne dis pas que moi j'en ferai un :lol: ) Mais c'est le seul intérêt.

La différence, c'est que l'intérêt de programmation d'un moteur de recherche, c'est l'algorithme de pertinence (au niveau du bot et au moment de la requête).
Bref ici, c'est "juste" un extrayeur de mots choisis sur une page, un suiveur de liens, et une simple requête sql ... bref, pas un moteur de recherche :)
 
WRInaute discret
Désolé Bh&quo tu n'as pas tout compris.
Qui a dit que je ne cherchais pas la pertinence ?

Voire meme qui a dit que les résultats étaient si mauvais ? Ca dépend de ce que tu cherches (typologiquement parlant)

Ce que tu appelles 'extrayeur de mot' est un peu plus complexe et tient compte de plus de choses (balises encadrantes, répétition etc...)

Et une 'simple requete sql ' (!!) non plus ! L'ordre des mots de la requete comptent et le poids des mots dans la page recherché aussi.

ytz

PS : ce n'est pas du sql non plus
 
WRInaute discret
Ytz a dit:
Qui a dit que je ne cherchais pas la pertinence ?

C'est ptet le "affichage final des résultats aléatoire : pas de tri pagerankesque, tout site dont le contenu correspond à la requete à donc autant de chance qu'un autre" qui m'a fait dire ça :)
 
WRInaute discret
ok !

En fait :

1-recherche des pages pertinentes par rapport a la requete

2-affichage aléatoire parmi les résultats (puisque ce sont des sites qui ne sont plus départageables sur le critère "pertinence")
 
WRInaute discret
Mouais, certes ça ressemble à un moteur, mais ça n'en est pas un...

Je considère ça comme une sorte d'annuaire avec un moteur de recherche...

mais continue à développer ton projet, peut-être va-t'il devenir intéressant plus atrd ;)
 
Discussions similaires
Haut