Lire un index Lucene
7 messages
• Page 1 sur 1
-

ecocentric - WRInaute accro

- Messages: 3602
- Inscription: 10 Fév 2004
Lire un index Lucene
Connaissez-vous une bibliothèque PHP que le puisse mettre sur un mutualisé et capable de lire un index Lucene ?
EDIT 2 - Autre solution que Zend ? ( http://framework.zend.com/manual/fr/zen ... ching.html )
EDIT 1 - Zend framework sur un mutu, vous avez déjà testé (il y a un portage Lucene dedans...) ?
EDIT 2 - Autre solution que Zend ? ( http://framework.zend.com/manual/fr/zen ... ching.html )
EDIT 1 - Zend framework sur un mutu, vous avez déjà testé (il y a un portage Lucene dedans...) ?
-

ecocentric - WRInaute accro

- Messages: 3602
- Inscription: 10 Fév 2004
> Que cherches tu as faire ?
J'ai créé plusieurs moteurs de recherche spécialisés (news, podcasts, BitTorrent, etc ; d'autres vont pê suivre), généralement basés sur des développements personnels (fichiers texte ou MySQL FULLTEXT), et m'interroge sur l'opportunité, pour certains développements, de travailler avec un index standard (notamment pour des raisons de pertinence). D'où mon intérêt pour Lucene.
Pour le moment, tout est hébergé sur des mutualisés : c'est suffisamment performant et ça ne me coûte pas cher.
Ce à quoi je pense :
- faire un crawl ciblé avec mon crawler (nouveau développement Python, pas super rapide -améliorable-, mais très simple et très souple côté paramétrage).
- faire une indexation avec PyLucene (je le prendrais plutôt que Lucene parce que je maîtrise mieux Python et que, de plus, Java est un langage que je trouve personnellement assez lourd).
- envoyer les index Lucene par FTP (apparemment, ce sont de simple fichiers, donc c'est faisable).
- interroger ces index sur le mutualisé en PHP.
C'est sur ce dernier point que je vois moins la solution.
Pour replacer ça dans un contexte plus global, j'ai commencé à développer une boîte à outil modulaire pour créer des moteurs spécialisés, sachant que mon idée est de pouvoir choisir des modules à la carte suivant le type de moteur que je veux développer.
Ton avis m'intéresse, j'ai déjà remarqué que tu étais bien branché technologie de recherche
.
Note : Je connais Nutch, mais il me paraît trop lourd pour ce que je veux développer, qui de plus ne nécessite pas de crawls massifs.
EDIT - donc, je ne cherche pas de portage Lucene complet pour PHP, ce que je cherche, c'est plutôt la possibilité d'interroger un index Lucene en PHP.
J'ai créé plusieurs moteurs de recherche spécialisés (news, podcasts, BitTorrent, etc ; d'autres vont pê suivre), généralement basés sur des développements personnels (fichiers texte ou MySQL FULLTEXT), et m'interroge sur l'opportunité, pour certains développements, de travailler avec un index standard (notamment pour des raisons de pertinence). D'où mon intérêt pour Lucene.
Pour le moment, tout est hébergé sur des mutualisés : c'est suffisamment performant et ça ne me coûte pas cher.
Ce à quoi je pense :
- faire un crawl ciblé avec mon crawler (nouveau développement Python, pas super rapide -améliorable-, mais très simple et très souple côté paramétrage).
- faire une indexation avec PyLucene (je le prendrais plutôt que Lucene parce que je maîtrise mieux Python et que, de plus, Java est un langage que je trouve personnellement assez lourd).
- envoyer les index Lucene par FTP (apparemment, ce sont de simple fichiers, donc c'est faisable).
- interroger ces index sur le mutualisé en PHP.
C'est sur ce dernier point que je vois moins la solution.
Pour replacer ça dans un contexte plus global, j'ai commencé à développer une boîte à outil modulaire pour créer des moteurs spécialisés, sachant que mon idée est de pouvoir choisir des modules à la carte suivant le type de moteur que je veux développer.
Ton avis m'intéresse, j'ai déjà remarqué que tu étais bien branché technologie de recherche
Note : Je connais Nutch, mais il me paraît trop lourd pour ce que je veux développer, qui de plus ne nécessite pas de crawls massifs.
EDIT - donc, je ne cherche pas de portage Lucene complet pour PHP, ce que je cherche, c'est plutôt la possibilité d'interroger un index Lucene en PHP.
-

ecocentric - WRInaute accro

- Messages: 3602
- Inscription: 10 Fév 2004
spidetra a écrit:Sur ton mutualisé, ni Python, ni Java ?
Le support Python CGI est assez bof sur cet hébergeur-là.
spidetra a écrit:Sinon j'aurai dit :
Lucene <-> PyLucene <-> XML <-> Php.
XML ?
Tu parles d'installer PyLucene sur le mutu et de récupérer les résultats aux requêtes en XML ?
- shrom
- WRInaute impliqué

- Messages: 865
- Inscription: 5 Juil 2004
Pour ce qui est de l'utilisation des index Lucene en PHP, à part le Zend Framework, je ne vois rien d'autre, de toute façon, une solution basée à 100% sur PHP ne me semble pas réellement viable, les algos utilisés sont complexes et PHP n'est pas réputé pour être efficace sur ce point.
Une solution serait de faire une extension PHP en compilant Lucene avec GCJ, mais là, il faut un dédié.
Sinon, tu peut peut être te tourner vers mnogosearch, certains mutualisés ont l'extension d'activée et si tu as de bonnes relations avec ton hébergeur, il peut peut être te l'installer.
Une solution serait de faire une extension PHP en compilant Lucene avec GCJ, mais là, il faut un dédié.
Sinon, tu peut peut être te tourner vers mnogosearch, certains mutualisés ont l'extension d'activée et si tu as de bonnes relations avec ton hébergeur, il peut peut être te l'installer.
7 messages
• Page 1 sur 1
Lectures recommandées sur ce thème :
- à lire
- lire un fichier ioncube
- Comment lire le log?
- Lire un robots.txt
- lire ses mp
- lire un avi sur freebox HD
- lire fichier XML en javascript
- Adsense ne sait pas lire...
- Merci aux nouveaux de lire :
- Faut clicks message à lire !
- Lire la source d'une URI
- Iliad et annu - article à lire
- AVIS PERSO.........lire svp....
- Faire lire un site avec sa police ?
- lire une webradio sur un site
- Wikia Search sort en version alpha : premières impressions - 07-01-2008
- Gmail Mobile : lire ses mails sur son mobile - 16-12-2005
- Ask dévoile sa technologie RhymeRank - 31-03-2006
- Le code source du projet de recherche géographique est disponible - 05-06-2002
- 101 manières d'obtenir des liens pour son site web - 16-08-2006
- Les pays gérés par la Google Toolbar 2.0 - 26-06-2003
- Nouvelle version du TouchGraph Google Browser - 25-01-2003
- Nouvelle faille qui touche de nombreux services de Google - 16-04-2008
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

