Moteur de recherche Intranet Open Source

Consultez la formation sur les stratégies de liens de WebRankInfo / Ranking Metrics

Tigre de Sibérie
Nouveau WRInaute
 
Messages: 18
Inscription: Ven Sep 01, 2006 9:26

Moteur de recherche Intranet Open Source

Message le Mer Déc 13, 2006 21:12

Bonsoir,

J'ai cherché peut être mal, mais je n'ai pas trouvé une discussion qui m'indiquerait quels sont les meilleurs moteurs de recherches libres facilement intégrables pour un intranet.

L'objectif est de créer un serveur de documents pdf avec recherche par le contenu.

Un petit outil simple serait idéal.

Merci


ecocentric
WRInaute accro
WRInaute accro
 
Messages: 3577
Inscription: Mar Fév 10, 2004 16:40

Message le Mer Déc 13, 2006 21:17

Nutch


ecocentric
WRInaute accro
WRInaute accro
 
Messages: 3577
Inscription: Mar Fév 10, 2004 16:40

Message le Mer Déc 13, 2006 21:20

si c'est juste pour des doc PDF, ya un intégration de Lucene .Net sous la forme d'un serveur d'indexation qui devrait convenir (Nutch est utile si tu as besoin d'un crawler).

EDIT - Voilà l'info : http://www.netoscope.org/2006/shortnews20060303.php

Tigre de Sibérie
Nouveau WRInaute
 
Messages: 18
Inscription: Ven Sep 01, 2006 9:26

Message le Mer Déc 13, 2006 21:26

Merci ecocentric

Comment se presente Lucene .net

Je ne souhaiterais pas d'indexation manuelle, mais une simple recherche par le contenu.


ecocentric
WRInaute accro
WRInaute accro
 
Messages: 3577
Inscription: Mar Fév 10, 2004 16:40

Message le Mer Déc 13, 2006 21:29

Tigre de Sibérie a écrit:Merci ecocentric

Comment se presente Lucene .net

Je ne souhaiterais pas d'indexation manuelle, mais une simple recherche par le contenu.


Lucene .Net, c'est une trousse à outil d'indexation. Tu lui balances du texte, il crée un index. Tu as une API pour lancer des recherches, le modèled e pertinence est configuré par défaut.

Si tu veux un index réseau déjà tout fait, tu prends Seekafile, tout est déjà codé. Si tu veux un crawler d'Intranet, tu prends Nutch (différence : c'est le Lucene original en Java qui est intégré dans Nutch).

Si tu veux recoder un système toi-même, tu devras t'occuper de la conversion des documents en texte, par exemple via iFilter sous Windows (il y a d'autres bibliothèque, notamment en Java, pour Linux).
Dernière édition par ecocentric le Mer Déc 13, 2006 21:36, édité 1 fois.

Tigre de Sibérie
Nouveau WRInaute
 
Messages: 18
Inscription: Ven Sep 01, 2006 9:26

Message le Mer Déc 13, 2006 21:35

Merci beaucoup
Je vais voir.


Xou
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 187
Inscription: Ven Juin 02, 2006 16:52

Message le Jeu Déc 14, 2006 12:27

Bonjour,

htdig également. ;)


Formation recommandée sur ce thème :

Formation Netlinking (liens et référencement) : apprenez ce qu'est réellement un bon lien pour le référencement et surtout comment en obtenir. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Analyser le positionnement d'un site
    AgentWebRanking est un logiciel professionnel qui permet d'analyser le positionnement d'un ou plusieurs sites dans plus de 300 moteurs de recherche dans le monde. Vous pouvez ainsi analyser les performances du référencement pour de nombreux mots-clés.
  • Recherche de citations d'un site en texte brut
    Cet outil vous permet de trouver des pages citant votre site mais ne faisant pas (encore) de lien. Il suffira parfois d'un simple mail pour transformer cette simple citation en lien (backlink).


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités