Lire un index Lucene


ecocentric
WRInaute accro
WRInaute accro
 
Messages: 3602
Inscription: 10 Fév 2004

Lire un index Lucene

Message le Lun Juil 10, 2006 15:35

Connaissez-vous une bibliothèque PHP que le puisse mettre sur un mutualisé et capable de lire un index Lucene ?

EDIT 2 - Autre solution que Zend ? ( http://framework.zend.com/manual/fr/zen ... ching.html )
EDIT 1 - Zend framework sur un mutu, vous avez déjà testé (il y a un portage Lucene dedans...) ?

spidetra
WRInaute passionné
WRInaute passionné
 
Messages: 1500
Inscription: 7 Juil 2003

Re: Lire un index Lucene

Message le Jeu Juil 13, 2006 8:54

...
Dernière édition par spidetra le Ven Aoû 04, 2006 13:15, édité 1 fois.


ecocentric
WRInaute accro
WRInaute accro
 
Messages: 3602
Inscription: 10 Fév 2004

Message le Jeu Juil 13, 2006 10:09

> Que cherches tu as faire ?

J'ai créé plusieurs moteurs de recherche spécialisés (news, podcasts, BitTorrent, etc ; d'autres vont pê suivre), généralement basés sur des développements personnels (fichiers texte ou MySQL FULLTEXT), et m'interroge sur l'opportunité, pour certains développements, de travailler avec un index standard (notamment pour des raisons de pertinence). D'où mon intérêt pour Lucene.

Pour le moment, tout est hébergé sur des mutualisés : c'est suffisamment performant et ça ne me coûte pas cher.

Ce à quoi je pense :
- faire un crawl ciblé avec mon crawler (nouveau développement Python, pas super rapide -améliorable-, mais très simple et très souple côté paramétrage).
- faire une indexation avec PyLucene (je le prendrais plutôt que Lucene parce que je maîtrise mieux Python et que, de plus, Java est un langage que je trouve personnellement assez lourd).
- envoyer les index Lucene par FTP (apparemment, ce sont de simple fichiers, donc c'est faisable).
- interroger ces index sur le mutualisé en PHP.

C'est sur ce dernier point que je vois moins la solution.

Pour replacer ça dans un contexte plus global, j'ai commencé à développer une boîte à outil modulaire pour créer des moteurs spécialisés, sachant que mon idée est de pouvoir choisir des modules à la carte suivant le type de moteur que je veux développer.

Ton avis m'intéresse, j'ai déjà remarqué que tu étais bien branché technologie de recherche ;-) .

Note : Je connais Nutch, mais il me paraît trop lourd pour ce que je veux développer, qui de plus ne nécessite pas de crawls massifs.

EDIT - donc, je ne cherche pas de portage Lucene complet pour PHP, ce que je cherche, c'est plutôt la possibilité d'interroger un index Lucene en PHP.

spidetra
WRInaute passionné
WRInaute passionné
 
Messages: 1500
Inscription: 7 Juil 2003

Message le Jeu Juil 13, 2006 10:36

...
Dernière édition par spidetra le Ven Aoû 04, 2006 13:15, édité 1 fois.


ecocentric
WRInaute accro
WRInaute accro
 
Messages: 3602
Inscription: 10 Fév 2004

Message le Jeu Juil 13, 2006 10:39

spidetra a écrit:Sur ton mutualisé, ni Python, ni Java ?

Le support Python CGI est assez bof sur cet hébergeur-là.

spidetra a écrit:Sinon j'aurai dit :
Lucene <-> PyLucene <-> XML <-> Php.


XML ?
Tu parles d'installer PyLucene sur le mutu et de récupérer les résultats aux requêtes en XML ?

spidetra
WRInaute passionné
WRInaute passionné
 
Messages: 1500
Inscription: 7 Juil 2003

Message le Jeu Juil 13, 2006 10:54

...
Dernière édition par spidetra le Ven Aoû 04, 2006 13:16, édité 1 fois.

shrom
WRInaute impliqué
WRInaute impliqué
 
Messages: 865
Inscription: 5 Juil 2004

Message le Jeu Juil 13, 2006 12:49

Pour ce qui est de l'utilisation des index Lucene en PHP, à part le Zend Framework, je ne vois rien d'autre, de toute façon, une solution basée à 100% sur PHP ne me semble pas réellement viable, les algos utilisés sont complexes et PHP n'est pas réputé pour être efficace sur ce point.

Une solution serait de faire une extension PHP en compilant Lucene avec GCJ, mais là, il faut un dédié.

Sinon, tu peut peut être te tourner vers mnogosearch, certains mutualisés ont l'extension d'activée et si tu as de bonnes relations avec ton hébergeur, il peut peut être te l'installer.


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités