script de calcul de densité en PHP

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

caro
WRInaute passionné
WRInaute passionné
 
Messages: 871
Inscription: Lun Juil 21, 2003 18:13

script de calcul de densité en PHP

Message le Mar Aoû 23, 2005 17:42

salut les gars,

je recherche un script php ou des fonctions php permettant de me faire un outil de calcul de densité que dans le corps de la page :

- densité des mots uniques
- densité des groupes de 2 mots
- densité des groupes de 3 mots

merci, je prens tout ce que vous pouvez donner :lol:


vpx
WRInaute accro
WRInaute accro
 
Messages: 1099
Inscription: Mar Mar 23, 2004 15:53

Message le Mar Aoû 23, 2005 20:16

Salut,
Ca dépend du detail que tu desires obtenir (densité dans le titre, densité dans le body en général, les metas, etc...).
Le principe n'est pas compliqué; tu peux utiliser la fonction SUBSTR_COUNT()


Blini
WRInaute passionné
WRInaute passionné
 
Messages: 506
Inscription: Lun Nov 29, 2004 8:59

Message le Mer Aoû 24, 2005 7:04

il y a aussi str_word_count($chaine, 2) qui te renvoie un tableau des mots avec leur position dans la chaine.

caro
WRInaute passionné
WRInaute passionné
 
Messages: 871
Inscription: Lun Juil 21, 2003 18:13

Message le Mer Aoû 24, 2005 15:15

en fait je me suis mal exprimée, je cherche les densités que dans le corps de la page,
mais je ne cherche pas sur un mot clé précis, je veux qu'il analyse la page et qu'il dise lui même par exemple :
clé unique : 5 fois le mot "clé1"
clé double : 3 fois le groupe de mots "clé1 clé2"

les fonctions que vous m'avez donné ne marche je crois que si on leur demande d'analyser un mot précis, je veux pas de mot précis, à lui de calculer le nombre de tous les mots qui reviennent.

merci pour votre aide
là je galère pas mal
caro


vpx
WRInaute accro
WRInaute accro
 
Messages: 1099
Inscription: Mar Mar 23, 2004 15:53

Message le Mer Aoû 24, 2005 15:21

Il suffit de bidouiller un peu. Par exemple pour analyser la home de Google:
Code: Tout sélectionner
<?
$chaine=strtolower(strip_tags(file_get_contents("http://www.google.fr/")));
$tout= str_word_count ($chaine);
$total[0]=array_unique((str_word_count ($chaine,1)));
foreach ($total[0] as $expression)
{
$occurence=substr_count($chaine, $expression);
$densite= ($occurence*100/$tout);
if ($densite>0.1 && strlen($expression)>5){echo "$expression => $densite %<br>";}
}
?>.

La, ca analyse les mots de plus de 5 lettres, et ayant une densité superieure à 0.1%. Tu devrais facilement pouvoir adapter pour obtenir exactement ce que tu veux. ;)

caro
WRInaute passionné
WRInaute passionné
 
Messages: 871
Inscription: Lun Juil 21, 2003 18:13

Message le Mer Aoû 24, 2005 15:30

merci beaucoup ca a l'air d'être exactement ce que je cherche.
je vais bien analyser tout ca
encore merci :wink:

caro
WRInaute passionné
WRInaute passionné
 
Messages: 871
Inscription: Lun Juil 21, 2003 18:13

Message le Jeu Aoû 25, 2005 13:18

ca marche pô,
dans l'exemple que donne vpx, il faut analyser une clé ($expression),
moi je veux pas analyser une clé précise, je veux qu'un tableau s'affiche avec la densité de tous les mots.

pour mieux comprendre, se rendre à l'adresse suivante, c'est ce système que j'ai besoin :
searchengineworld.com/cgi-bin/kwda.cgi

dans ce systeme, on notre juste l'url d'une page, et ca donne la densité de tous les mots de la page.
Dernière édition par caro le Jeu Aoû 25, 2005 14:19, édité 2 fois.


Blini
WRInaute passionné
WRInaute passionné
 
Messages: 506
Inscription: Lun Nov 29, 2004 8:59

Message le Jeu Aoû 25, 2005 13:52

Code: Tout sélectionner
<?php
$str = strtolower(strip_tags(file_get_contents("http://www.google.fr/")));
$tab = str_word_count($str, 2);
$occ = array();
foreach ($tab as $word)
{
   if (!isset($occ[$word]))
      $occ[$word] = 0;
   $occ[$word]++;
}
print('<pre>');
print_r($occ);
print('</pre>');
?>


ensuite, tu calcules la densité, tu retiens que les mots de plus de N lettres, etc...

caro
WRInaute passionné
WRInaute passionné
 
Messages: 871
Inscription: Lun Juil 21, 2003 18:13

Message le Jeu Aoû 25, 2005 14:15

merci vraiment à tous les 2 (vpx et blini) pour votre aide et votre patience, au fait le code de vpx marchait aussi mais j'ai eu du mal à comprendre au début :lol:
carole


Blini
WRInaute passionné
WRInaute passionné
 
Messages: 506
Inscription: Lun Nov 29, 2004 8:59

Message le Ven Aoû 26, 2005 9:06

@ vpx: désolé, j'ai pas écrit ce bout de code pour dire "c'est mieux ce que proposes vpx", j'avais juste lu la réponse de caro disant que ça marchait pas :/


yvan02
WRInaute impliqué
WRInaute impliqué
 
Messages: 412
Inscription: Mer Mar 02, 2005 15:08

et pour des groupe de mots

Message le Ven Oct 14, 2005 8:50

Bonjour,

Je suis tombé sur ce post en cherchant un exemple de script PHP pour la densité des mots.
Très bien, le script, je ne connaissais pas ces fonctions.
Mais, le script ne donne l'occurence que pour des mots uniques.
Comment faire pour qu'il donne également l'occurence des expressions composées de 2 ou 3 mots ?

Patrouilleur
Nouveau WRInaute
 
Messages: 10
Inscription: Jeu Oct 13, 2005 9:37

Message le Ven Oct 14, 2005 10:30

merci beaucoup pour cette discussion ça m'a ouvert des pistes pour comparer deux saisies de textes ;)

caro
WRInaute passionné
WRInaute passionné
 
Messages: 871
Inscription: Lun Juil 21, 2003 18:13

Message le Ven Oct 14, 2005 11:31

puisque yvan02 relève ce sujet, je suis aussi intéressée pour savoir comment faire pour trouver les densités de "groupes de mots".
merci :wink:


yvan02
WRInaute impliqué
WRInaute impliqué
 
Messages: 412
Inscription: Mer Mar 02, 2005 15:08

Message le Dim Oct 16, 2005 9:33

En fait, il suffit de balayer toutes les combinaisons de 2, 3 motsà partir de la liste des mots uniques. Pour chaque combinaison, on teste si elle est présente dans l'ensemble des mots du texte.
J'aurai donné le script, mon celui pour mon cas personnel est un peu particulier car je dresse la liste des occurences des textes de backlinks et non du contenu.

Un début de code pour les combinaisons de 2 mots
Code: Tout sélectionner
foreach ($tousmots as $cle1 =>  $mot1) {
foreach ($tousmots as $cle2 => $mot2) {
  $expression = $mot1." ".$mot2;
  // et on test la présence de $expression dans tout le contenu du texte
  ....
 
}
}


hertcl
Nouveau WRInaute
 
Messages: 1
Inscription: Jeu Aoû 24, 2006 12:40

Message le Mar Aoû 29, 2006 14:32

Bonjour,

Je ne sais pas si ce sujet vit encore, mais je suis exactement dans la même position que Caro il y a un an, avec le même type de besoin.
J'ai utilisé jusqu'à présent des sites web qui proposent gratuitement ce genre de services (sujet d'ailleurs traité ailleurs sur ce forum : http://www.webrankinfo.com/forums/viewtopic_35969.htm ) mais j'en suis arrivé à la conclusion que la réalisation d'un outil "propre", qui permette d'exclure une liste de termes que l'on ne souhaiterait pas compter (la le lui un ...) serait plus sympatique.
Jusqu'à présent, je n'ai pas réellement trouvé de scripts PHP tout faits sur internet (quoique http://www.stargeek.com/php_scripts.php?script=21 ) mais je ne désespère pas, vu que je sais pas coder du php...
Je suis preneur de vos retours d'expérience.
Bien cordialement,


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Calcul du taux de liens vers des pages internes
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.
  • Calcul de l'indice de co-occurrence
    Cet outil vous permet de calculer l'indice de co-occurrence de 2 ou 3 termes, ainsi que le ratio E/F. L'indice de co-occurrence mesure le relation entre les termes : plus cet indice est élevé, plus les termes sont reliés. Concrètement, plus l'indice est élevé, plus il est fréquent de trouver des documents qui contiennent les différents termes.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités