nouvel outil : calcul d'indice de densité
8 messages
• Page 1 sur 1
-

WebRankInfo - Administrateur du site

- Messages: 19415
- Inscription: 19 Avr 2002
nouvel outil : calcul d'indice de densité
Voilà la version beta (version de test) tout juste sortie...
Je vous laisse l'essayer et me lister tous les problèmes que vous rencontrez.
N'hésitez pas non plus à faire des remarques, cet outil sera le vôtre alors autant qu'il corresponde à vos besoins
http://www.webrankinfo.com/outils/indice-densite.php
Je vous laisse l'essayer et me lister tous les problèmes que vous rencontrez.
N'hésitez pas non plus à faire des remarques, cet outil sera le vôtre alors autant qu'il corresponde à vos besoins
http://www.webrankinfo.com/outils/indice-densite.php
- Mirgolth
- WRInaute impliqué

- Messages: 622
- Inscription: 14 Oct 2002
Petit pb de gestion des erreurs:
Je me suis trompé en tapant mon URL et j'ai eut les warning suivant :
Warning: php_network_getaddresses: getaddrinfo failed: Name or service not known in /home/webranki/www/lib/indice-densite.lib.php on line 86
Warning: file("http://ldvelh.free/fr/") - Bad file descriptor in /home/webranki/www/lib/indice-densite.lib.php on line 86
Warning: Bad arguments to join() in /home/webranki/www/lib/indice-densite.lib.php on line 86
Warning: php_network_getaddresses: getaddrinfo failed: Name or service not known in /home/webranki/www/lib/strings.lib.php on line 94
Warning: get_meta_tags("http://ldvelh.free/fr/") - Bad file descriptor in /home/webranki/www/lib/strings.lib.php on line 94
Mirgolth
L'encyclopédie des Livres dont vous êtes le Héros
Je me suis trompé en tapant mon URL et j'ai eut les warning suivant :
Warning: php_network_getaddresses: getaddrinfo failed: Name or service not known in /home/webranki/www/lib/indice-densite.lib.php on line 86
Warning: file("http://ldvelh.free/fr/") - Bad file descriptor in /home/webranki/www/lib/indice-densite.lib.php on line 86
Warning: Bad arguments to join() in /home/webranki/www/lib/indice-densite.lib.php on line 86
Warning: php_network_getaddresses: getaddrinfo failed: Name or service not known in /home/webranki/www/lib/strings.lib.php on line 94
Warning: get_meta_tags("http://ldvelh.free/fr/") - Bad file descriptor in /home/webranki/www/lib/strings.lib.php on line 94
Mirgolth
L'encyclopédie des Livres dont vous êtes le Héros
- Julien
- WRInaute discret

- Messages: 66
- Inscription: 4 Sep 2002
J'ai effectué un test simple avec
url: http://www.lnf.fr
mots: untitled document (qui n'apparait q'une unique fois dans le titre)
résultats:
Global Titre Description Page
untitled 14.3% 50.0% 0.0% 9.1%
document 14.3% 50.0% 0.0% 9.1%
untitled document 4.08% 50.00% 0.00% 1.65%
les résultats devraient plutot être:
Global Titre Description Page
untitled 14.3% 50.0% 0.0% 0%
document 14.3% 50.0% 0.0% 0%
untitled document 4.08% 100.00% 0.00% 0%
car ces 2 mots n'apparaissent jamais dans la page (entre les balises body)
je crois que tu as oublié de diviser par {nombre mots total - nombre de mots cherchés} comme l'avait expliqué jeanNo avant.
Sinon, ça marche assez bien, c'est encourrageant!
Julien
url: http://www.lnf.fr
mots: untitled document (qui n'apparait q'une unique fois dans le titre)
résultats:
Global Titre Description Page
untitled 14.3% 50.0% 0.0% 9.1%
document 14.3% 50.0% 0.0% 9.1%
untitled document 4.08% 50.00% 0.00% 1.65%
les résultats devraient plutot être:
Global Titre Description Page
untitled 14.3% 50.0% 0.0% 0%
document 14.3% 50.0% 0.0% 0%
untitled document 4.08% 100.00% 0.00% 0%
car ces 2 mots n'apparaissent jamais dans la page (entre les balises body)
je crois que tu as oublié de diviser par {nombre mots total - nombre de mots cherchés} comme l'avait expliqué jeanNo avant.
Sinon, ça marche assez bien, c'est encourrageant!
Julien
-

WebRankInfo - Administrateur du site

- Messages: 19415
- Inscription: 19 Avr 2002
OK je regarderai dès que possible pourquoi j'obtiens ces résultats...
-

WebRankInfo - Administrateur du site

- Messages: 19415
- Inscription: 19 Avr 2002
Julien a écrit:je crois que tu as oublié de diviser par {nombre mots total - nombre de mots cherchés} comme l'avait expliqué jeanNo avant.
J'ai corrigé le pb sur le calcul de la partie "body", par contre je ne comprends pas pourquoi tu veux diviser par autre chose que le nombre de mots total ?
j'ai relu notre discussion sur http://www.webrankinfo.com/forums/viewt ... e&start=15
prenons l'exemple du calcul de l'IDM de "document" pour http://www.lnf.fr/
il apparait 1 fois dans le titre, sur 2 mots.
Son IDM est donc 1! * 1 / 2 = 0.5 = 50%
Si tu divises par {nombre mots total - nombre de mots cherchés}, tu trouves 1! * 1 / (2-1) = 1 = 100% ce qui ne va pas !
par contre pour l'exemple "untitled document", je pensais trouver 100% mais le calcul donne : 2! * 0.5 * 0.5 = 0.5 = 50%
- Julien
- WRInaute discret

- Messages: 66
- Inscription: 4 Sep 2002
ça dépend de ce que l'on cherche
soit "mot1 mot2" soit mot1 mot2 (pas d'ordre)
Dans le cas de l'ordre respecté, on avait établi que:
P("google référencement" | X) = {nombre de fois où "google référencement" apparait} / ({nombre total de mots} - 1)
qu'il faut limité à un nombre de mots >1
le 1 est en fait le nombre de mots recherchés - 1
soit la formule générale:
P("mot1 mot2 motN" | X) = {nombre de fois où "mot1 mot2 motN" apparait} / ({nombre total de mots} - {N-1} )
prenons l'exemple du calcul de l'IDM de "document" pour http://www.lnf.fr/
il apparait 1 fois dans le titre, sur 2 mots.
Son IDM est donc 1 / (2 - {1-1}) = 0.5 = 50%
par contre pour l'exemple "untitled document", le calcul donne :
1 / (2 - {2-1}) = 1 = 100%
La proba donnée par jeanNO correspond à un evenement different:
C'est la probabilité d'obtenir "untitled document" a partir de duplet { untitled, document } qui est bien 0.5, car l'autre unique possiblité de proba 0.5 est "document untitled"
on retouve donc bien somme (proba(evenement)) = 1
soit "mot1 mot2" soit mot1 mot2 (pas d'ordre)
Dans le cas de l'ordre respecté, on avait établi que:
P("google référencement" | X) = {nombre de fois où "google référencement" apparait} / ({nombre total de mots} - 1)
qu'il faut limité à un nombre de mots >1
le 1 est en fait le nombre de mots recherchés - 1
soit la formule générale:
P("mot1 mot2 motN" | X) = {nombre de fois où "mot1 mot2 motN" apparait} / ({nombre total de mots} - {N-1} )
prenons l'exemple du calcul de l'IDM de "document" pour http://www.lnf.fr/
il apparait 1 fois dans le titre, sur 2 mots.
Son IDM est donc 1 / (2 - {1-1}) = 0.5 = 50%
par contre pour l'exemple "untitled document", le calcul donne :
1 / (2 - {2-1}) = 1 = 100%
La proba donnée par jeanNO correspond à un evenement different:
par contre pour l'exemple "untitled document", je pensais trouver 100% mais le calcul donne : 2! * 0.5 * 0.5 = 0.5 = 50%
C'est la probabilité d'obtenir "untitled document" a partir de duplet { untitled, document } qui est bien 0.5, car l'autre unique possiblité de proba 0.5 est "document untitled"
on retouve donc bien somme (proba(evenement)) = 1
-

WebRankInfo - Administrateur du site

- Messages: 19415
- Inscription: 19 Avr 2002
Julien a écrit:soit la formule générale:
P("mot1 mot2 motN" | X) = {nombre de fois où "mot1 mot2 motN" apparait} / ({nombre total de mots} - {N-1} )
C'est donc cette formule que je vais utiliser. Pour l'instant je divisais par {nombre total de mots}.
Vous avez trouvé d'autres problèmes avec cet outil ?
Vous avez des idées d'amélioration ?
-

WebRankInfo - Administrateur du site

- Messages: 19415
- Inscription: 19 Avr 2002
en fait ce que je comptais proposer, c'est plutôt la version qui ne respecte pas l'ordre.
on avait parlé de cette formule :
P({mot1, mot2, ..., motn} | X) = n! {nbre mot1}.{nbre mot2}...{nbre motn} / {nbre total de mots}^n = n! IDM_mot1 * IDM_mot2 * ... * IDM_motn
mais apparemment ce n'est pas encore ça ?
on avait parlé de cette formule :
P({mot1, mot2, ..., motn} | X) = n! {nbre mot1}.{nbre mot2}...{nbre motn} / {nbre total de mots}^n = n! IDM_mot1 * IDM_mot2 * ... * IDM_motn
mais apparemment ce n'est pas encore ça ?
8 messages
• Page 1 sur 1
Lectures recommandées sur ce thème :
- quel est le meilleur outil de calcul de densité
- Quel outil de calcul de densité utilisez-vous?
- Nouvel outil : Calcul du pagerank moyen
- indice de densité
- outils indice-densite hs?
- Indice densité mots clés.
- indice de densité des mots clés
- Calcul de la densité ...
- Calcul d'indice de densité
- Calcul d'indice de densité, probleme ?
- Calculer l'indice de co-occurrence et le ratio E/F
- Nouvel outil : calculez la visibilité de votre site
- WebRankInfo lance un forum rédaction et référencement
- Outil : calcul de popularité sur les réseaux sociaux
- Nouvelle étude de WebRankInfo : les mots-clés et le référencement
- Comment être premier sur Google : la vidéo d'explications
- L'algorithme BlockRank
- Analyse de pages similaires
Consultez la description détaillée des produits ou services de Google suivants : Google Compute
- Calcul d'indice de densité
Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page. - Calcul de l'indice de co-occurrence
Cet outil vous permet de calculer l'indice de co-occurrence de 2 ou 3 termes, ainsi que le ratio E/F. L'indice de co-occurrence mesure le relation entre les termes : plus cet indice est élevé, plus les termes sont reliés. Concrètement, plus l'indice est élevé, plus il est fréquent de trouver des documents qui contiennent les différents termes. - Calcul du taux de liens vers des pages internes
Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
