Natural Language Processing With Linux

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

spidetra
WRInaute passionné
WRInaute passionné
 
Messages: 1500
Inscription: 7 Juil 2003

Natural Language Processing With Linux

Message le Jeu Oct 20, 2005 15:14

Voici une distribution Linux spécialisée dans l'analyse de texte :
http://morphix-nlp.berlios.de/

Morphix-NLP is a Live CD Linux distribution with a rich collection of Natural Language Processing (NLP) applications. Though the field of NLP has undergone decades of intensive research, software designed in the NLP community are often scattered around the net and are not known by the larger computer user community. Consequently, most NLP software can not be found in mainstream distributions even years after the first public release.


je suis en train de la télécharger, donc pour l'instant je ne peux pas vous en dire plus.
a voir si les outils sont accessibles au commun des mortels ou réservés aux spécialistes du traitement du langage.

Voici un exemple d'outil disponoble dans la distrib :
http://morphix-nlp.berlios.de/manual/node26.html

un outil pour trouver les co-occurrences dans un corpus

spidetra
WRInaute passionné
WRInaute passionné
 
Messages: 1500
Inscription: 7 Juil 2003

Message le Ven Oct 21, 2005 9:41

Il y a vraiment bc d'outils à tester dans cette distrib. Je vous ferait un topo au fur et à mesure de mes tests.

Le plus simple :
WorNet 2.1 Browser : Outil de référence léxicale.
http://wordnet.princeton.edu/obtain
Fonctionne sous Windows, MacOs, Linux/Unix

1. Pour l'instant je n'ai qu'un thésaurus en anglais. je ne sais pas s'il existe des thésaurus compatibles dans toutes les langues.

Fonctionalités :
1 Substring search :
2 Recherche de sens
Pour chacun des sens trouvés :
3. Recherches de synonimes
4. Hyperonymes ( "car" est une sorte de...) et hyponymes (... est une sorte de "car" )
- "car" est un type de véhicule (hyperonymes)
- ambulance, convertible, cruiser sont des sortes de car (hyponymes)
5. Meronymes (parties de ) et holonymes ( est une partie de )
6. Domaines

Plus accessibles sous windows :
http://wordweb.info/free/
par contre je ne trouve pas de thesaurus français :(


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Writer et 0 invités