methode de classification de documents

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

vallytiana
Nouveau WRInaute
 
Messages: 12
Inscription: Jeu Jan 27, 2005 7:11

methode de classification de documents

Message le Jeu Jan 12, 2006 11:31

je recherche un algorithme qui implemente la classification des documents basee sur le contenu textuel. c'est comme lorsque google affiche les resultats par ordre de priorite ou de pertinence.
merci bcp ;-)

lesbonsplansdesophie
WRInaute passionné
WRInaute passionné
 
Messages: 518
Inscription: Lun Mar 01, 2004 10:04

Message le Jeu Jan 12, 2006 12:26

tu cherches un algorithme pour classifier des docs suivant la frequence des mots qu'ils contiennent (un peu a la maniere de tagcloud ?)

vallytiana
Nouveau WRInaute
 
Messages: 12
Inscription: Jeu Jan 27, 2005 7:11

Message le Ven Jan 13, 2006 10:27

oui mais ce qu'il faut aussi savoir c'est qu'une page peut très bien parler de "sport" (donc plusieurs occurence du mot) sans rien à avoir avec.
exemple plus concret de ce que je veux faire:
- je veux classer en premier une page sur le sport qui parle de toutes les disciplines de l'athlétisme (mais à l'intérieur duquel, le mot sport n'apparaît que une ou deux fois et c'est tout)
- en second, un document sur les recettes effectuée par un magasin qui vend des articles de sport (donc n'a en premier lieu aucun rapport avec le mot mais à l'intérieur duquel "sport" ou "sportif" revient assez souvent)


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google TrustRank, Google Docs

  • Calcul de l'indice de cooccurrence
    Cet outil vous permet de calculer l'indice de co-occurrence de 2 ou 3 termes, ainsi que le ratio E/F. L'indice de co-occurrence mesure le relation entre les termes : plus cet indice est élevé, plus les termes sont reliés. Concrètement, plus l'indice est élevé, plus il est fréquent de trouver des documents qui contiennent les différents termes.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités