nouvel outil : calcul d'indice de densité


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 19415
Inscription: 19 Avr 2002

nouvel outil : calcul d'indice de densité

Message le Mar Oct 15, 2002 22:10

Voilà la version beta (version de test) tout juste sortie...
Je vous laisse l'essayer et me lister tous les problèmes que vous rencontrez.
N'hésitez pas non plus à faire des remarques, cet outil sera le vôtre alors autant qu'il corresponde à vos besoins :wink:

http://www.webrankinfo.com/outils/indice-densite.php

Mirgolth
WRInaute impliqué
WRInaute impliqué
 
Messages: 622
Inscription: 14 Oct 2002

Message le Mer Oct 16, 2002 8:38

Petit pb de gestion des erreurs:

Je me suis trompé en tapant mon URL et j'ai eut les warning suivant :

Warning: php_network_getaddresses: getaddrinfo failed: Name or service not known in /home/webranki/www/lib/indice-densite.lib.php on line 86

Warning: file("http://ldvelh.free/fr/") - Bad file descriptor in /home/webranki/www/lib/indice-densite.lib.php on line 86

Warning: Bad arguments to join() in /home/webranki/www/lib/indice-densite.lib.php on line 86

Warning: php_network_getaddresses: getaddrinfo failed: Name or service not known in /home/webranki/www/lib/strings.lib.php on line 94

Warning: get_meta_tags("http://ldvelh.free/fr/") - Bad file descriptor in /home/webranki/www/lib/strings.lib.php on line 94

Mirgolth
L'encyclopédie des Livres dont vous êtes le Héros

Julien
WRInaute discret
WRInaute discret
 
Messages: 66
Inscription: 4 Sep 2002

Message le Mer Oct 16, 2002 10:15

J'ai effectué un test simple avec
url: http://www.lnf.fr
mots: untitled document (qui n'apparait q'une unique fois dans le titre)

résultats:
Global Titre Description Page
untitled 14.3% 50.0% 0.0% 9.1%
document 14.3% 50.0% 0.0% 9.1%
untitled document 4.08% 50.00% 0.00% 1.65%

les résultats devraient plutot être:
Global Titre Description Page
untitled 14.3% 50.0% 0.0% 0%
document 14.3% 50.0% 0.0% 0%
untitled document 4.08% 100.00% 0.00% 0%

car ces 2 mots n'apparaissent jamais dans la page (entre les balises body)
je crois que tu as oublié de diviser par {nombre mots total - nombre de mots cherchés} comme l'avait expliqué jeanNo avant.

Sinon, ça marche assez bien, c'est encourrageant!
Julien


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 19415
Inscription: 19 Avr 2002

Message le Mer Oct 16, 2002 11:48

OK je regarderai dès que possible pourquoi j'obtiens ces résultats...


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 19415
Inscription: 19 Avr 2002

Message le Mer Oct 16, 2002 22:16

Julien a écrit:je crois que tu as oublié de diviser par {nombre mots total - nombre de mots cherchés} comme l'avait expliqué jeanNo avant.

J'ai corrigé le pb sur le calcul de la partie "body", par contre je ne comprends pas pourquoi tu veux diviser par autre chose que le nombre de mots total ?

j'ai relu notre discussion sur http://www.webrankinfo.com/forums/viewt ... e&start=15

prenons l'exemple du calcul de l'IDM de "document" pour http://www.lnf.fr/
il apparait 1 fois dans le titre, sur 2 mots.
Son IDM est donc 1! * 1 / 2 = 0.5 = 50%
Si tu divises par {nombre mots total - nombre de mots cherchés}, tu trouves 1! * 1 / (2-1) = 1 = 100% ce qui ne va pas !

par contre pour l'exemple "untitled document", je pensais trouver 100% mais le calcul donne : 2! * 0.5 * 0.5 = 0.5 = 50%

Julien
WRInaute discret
WRInaute discret
 
Messages: 66
Inscription: 4 Sep 2002

Message le Ven Oct 18, 2002 11:05

ça dépend de ce que l'on cherche

soit "mot1 mot2" soit mot1 mot2 (pas d'ordre)

Dans le cas de l'ordre respecté, on avait établi que:
P("google référencement" | X) = {nombre de fois où "google référencement" apparait} / ({nombre total de mots} - 1)
qu'il faut limité à un nombre de mots >1

le 1 est en fait le nombre de mots recherchés - 1

soit la formule générale:
P("mot1 mot2 motN" | X) = {nombre de fois où "mot1 mot2 motN" apparait} / ({nombre total de mots} - {N-1} )

prenons l'exemple du calcul de l'IDM de "document" pour http://www.lnf.fr/
il apparait 1 fois dans le titre, sur 2 mots.
Son IDM est donc 1 / (2 - {1-1}) = 0.5 = 50%

par contre pour l'exemple "untitled document", le calcul donne :
1 / (2 - {2-1}) = 1 = 100%


La proba donnée par jeanNO correspond à un evenement different:
par contre pour l'exemple "untitled document", je pensais trouver 100% mais le calcul donne : 2! * 0.5 * 0.5 = 0.5 = 50%

C'est la probabilité d'obtenir "untitled document" a partir de duplet { untitled, document } qui est bien 0.5, car l'autre unique possiblité de proba 0.5 est "document untitled"

on retouve donc bien somme (proba(evenement)) = 1


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 19415
Inscription: 19 Avr 2002

Message le Ven Oct 18, 2002 12:01

Julien a écrit:soit la formule générale:
P("mot1 mot2 motN" | X) = {nombre de fois où "mot1 mot2 motN" apparait} / ({nombre total de mots} - {N-1} )

C'est donc cette formule que je vais utiliser. Pour l'instant je divisais par {nombre total de mots}.

Vous avez trouvé d'autres problèmes avec cet outil ?
Vous avez des idées d'amélioration ?


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 19415
Inscription: 19 Avr 2002

Message le Ven Oct 18, 2002 18:37

en fait ce que je comptais proposer, c'est plutôt la version qui ne respecte pas l'ordre.
on avait parlé de cette formule :
P({mot1, mot2, ..., motn} | X) = n! {nbre mot1}.{nbre mot2}...{nbre motn} / {nbre total de mots}^n = n! IDM_mot1 * IDM_mot2 * ... * IDM_motn
mais apparemment ce n'est pas encore ça ?


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google Compute

  • Calcul d'indice de densité
    Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page.
  • Calcul de l'indice de co-occurrence
    Cet outil vous permet de calculer l'indice de co-occurrence de 2 ou 3 termes, ainsi que le ratio E/F. L'indice de co-occurrence mesure le relation entre les termes : plus cet indice est élevé, plus les termes sont reliés. Concrètement, plus l'indice est élevé, plus il est fréquent de trouver des documents qui contiennent les différents termes.
  • Calcul du taux de liens vers des pages internes
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités