Outils de lemmatisation / stemming

F
fsicre
Guest
Bonjour, je vous recommande les outils suivant que nous avons utilisés avec succès

http://sites.google.com/site/morfetteweb/home

http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/

(attention aux licences)
 
Nouveau WRInaute
Bonjour,

je vous recommande personnellement Treetagger également (http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/)

C'est l'outil de lemmatisation le plus couramment utilisé dans le monde de la recherche en traitement automatique des langues. Il fonctionne bien avec le français (95% de réussite il me semble).
 
WRInaute discret
Hello,
Je deterre un vieux topic mais ça intéressera peut être certains : j'ai mis un ligne un outil de lemmatisation il y a quelques temps : http://www.jerome-pasquelin.fr/tools/outil_lemmatisation.php
C'est un système par dictionnaire donc il est amené à évoluer au fur et à mesure car je le mets à jour (il y a plus de 100 000 relations déjà présentes) . Il est dispo ici : http://www.jerome-pasquelin.fr/tools/outil_lemmatisation.php

Ca sert à quoi? A aller un peu plus loin dans l'analyse sémantique : on regroupe les termes par racine.
Ex : chanter , chanson, chansons, chant, chantons, chantent, chanterait, ...correspondent à une seule et même racine.
Parfois on a des surprises quand on analyse de cette manière ;-)

PS : merci Sylvain Peyronnet (http://sylvain.berbiqui.org/) pour son aide
 
Olivier Duffez (admin)
Membre du personnel
au moins on peut dire que tu as bien profité des pages de WRI pour y mettre tes liens (ici et dans le blog) ;-)
néanmoins merci pour l'info
 
Discussions similaires
Haut