methode de classification de documents

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

vallytiana
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 12
Inscription: 27 Jan 2005

methode de classification de documents

Message le Jeu Jan 12, 2006 11:31

je recherche un algorithme qui implemente la classification des documents basee sur le contenu textuel. c'est comme lorsque google affiche les resultats par ordre de priorite ou de pertinence.
merci bcp ;-)

lesbonsplansdesophie
WRInaute impliqué
WRInaute impliqué
 
Messages: 523
Inscription: 1 Mar 2004

Message le Jeu Jan 12, 2006 12:26

tu cherches un algorithme pour classifier des docs suivant la frequence des mots qu'ils contiennent (un peu a la maniere de tagcloud ?)

vallytiana
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 12
Inscription: 27 Jan 2005

Message le Ven Jan 13, 2006 10:27

oui mais ce qu'il faut aussi savoir c'est qu'une page peut très bien parler de "sport" (donc plusieurs occurence du mot) sans rien à avoir avec.
exemple plus concret de ce que je veux faire:
- je veux classer en premier une page sur le sport qui parle de toutes les disciplines de l'athlétisme (mais à l'intérieur duquel, le mot sport n'apparaît que une ou deux fois et c'est tout)
- en second, un document sur les recettes effectuée par un magasin qui vend des articles de sport (donc n'a en premier lieu aucun rapport avec le mot mais à l'intérieur duquel "sport" ou "sportif" revient assez souvent)


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google TrustRank, Google Docs

  • Calcul de l'indice de cooccurrence
    Cet outil vous permet de calculer l'indice de co-occurrence de 2 ou 3 termes, ainsi que le ratio E/F. L'indice de co-occurrence mesure le relation entre les termes : plus cet indice est élevé, plus les termes sont reliés. Concrètement, plus l'indice est élevé, plus il est fréquent de trouver des documents qui contiennent les différents termes.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités