Un peu plus qu'un analyseur de densité
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- kalex
- WRInaute discret

- Messages: 241
- Inscription: 14 Sep 2004
Pour ceux qui m'avaient demandé de rendre publiques les pondérations effectuées, je commence avec cette petite page où je pense avoir listé les variables les plus importantes : http://alyze.info/InternalVars
Permettre aux utilisateurs de les modifier serait surement intéressant...
C'est la deuxième "fonctionnalité" que je crée grâce à vos suggestions. Merci.
Permettre aux utilisateurs de les modifier serait surement intéressant...
C'est la deuxième "fonctionnalité" que je crée grâce à vos suggestions. Merci.
-

dadovb - WRInaute passionné

- Messages: 2050
- Inscription: 22 Nov 2005
kalex a écrit:Pour ceux qui m'avaient demandé de rendre publiques les pondérations effectuées, je commence avec cette petite page où je pense avoir listé les variables les plus importantes : http://alyze.info/InternalVars
Permettre aux utilisateurs de les modifier serait surement intéressant...
C'est la deuxième "fonctionnalité" que je crée grâce à vos suggestions. Merci.
bien vu.
Ca correspond à la balise title ?Poids du titre (par défaut) : 13
- kalex
- WRInaute discret

- Messages: 241
- Inscription: 14 Sep 2004
Oui, c'est bien le <title>.
Là j'avais plusieurs choix, soit pondérer le titre et les métas comme des balises ordinaires, soit leur attribuer un poids par rapport au body. J'obtiens de meilleurs résultats avec cette dernière technique, mais ça pourra éventuellement faire l'objet d'une option lorsque les utilisateurs pourront définir eux-mêmes leurs critères (j'ai parlé au futur ? merde maintenant, il faut que je le code
).
Là j'avais plusieurs choix, soit pondérer le titre et les métas comme des balises ordinaires, soit leur attribuer un poids par rapport au body. J'obtiens de meilleurs résultats avec cette dernière technique, mais ça pourra éventuellement faire l'objet d'une option lorsque les utilisateurs pourront définir eux-mêmes leurs critères (j'ai parlé au futur ? merde maintenant, il faut que je le code
- tonguide
- WRInaute passionné

- Messages: 1393
- Inscription: 28 Nov 2003
As-tu essayé de faire une corrélation entre ton outil et des classements présent sur Google (notamment pour la pondération) ? Où c'est plutôt à la louche ?
Je demande ça, parce que je ne vois pas l'intérêt d'un tel outil. Ou plutôt, je vois difficilement comment appliquer une telle méthode à chaque page d'un site, à moins d'avoir vraiment beaucoup de temps sur chaque page créé. Sachant qu'en plus, personne ne peut dire ce qui est optimal.
Je demande ça, parce que je ne vois pas l'intérêt d'un tel outil. Ou plutôt, je vois difficilement comment appliquer une telle méthode à chaque page d'un site, à moins d'avoir vraiment beaucoup de temps sur chaque page créé. Sachant qu'en plus, personne ne peut dire ce qui est optimal.
- kalex
- WRInaute discret

- Messages: 241
- Inscription: 14 Sep 2004
Pour ce qui est de classer les termes par deux ou trois, après avoir travaillé sur la question pendant quelques heures, je pense que classer des mots clés composés de plusieurs mots clés n'a pas de sens, du moins avant la recherche.
Je sais, c'est surprenant, mais prenons un exemple, c'est assez simple. Le blog de Maître Eolas s'intitule "journal d'un avocat". Ce qui est important, c'est "journal" et "avocat", mais ces deux termes sont quand même séparés par deux mots. De plus, "journal" et "droit" serait tout aussi approprié pour une recherche, mais ces deux termes n'apparaissent pas cote à cote. De même pour "avocat" et "blog", "justice" et "droit", etc.
Si je veux classer les mots clés par deux ou trois, il me faut absolument des statistiques de recherche. Et je n'en ai malheureusement pas (Google si tu me lis, j'ai 120 Go de libres sur mon disque
).
Sinon, une fonction intéressante serait de permettre d'entrer plusieurs mots clés puis que le système dise pourquoi ils sont ou ne sont pas adaptés à la page.
Je sais, c'est surprenant, mais prenons un exemple, c'est assez simple. Le blog de Maître Eolas s'intitule "journal d'un avocat". Ce qui est important, c'est "journal" et "avocat", mais ces deux termes sont quand même séparés par deux mots. De plus, "journal" et "droit" serait tout aussi approprié pour une recherche, mais ces deux termes n'apparaissent pas cote à cote. De même pour "avocat" et "blog", "justice" et "droit", etc.
Si je veux classer les mots clés par deux ou trois, il me faut absolument des statistiques de recherche. Et je n'en ai malheureusement pas (Google si tu me lis, j'ai 120 Go de libres sur mon disque
Sinon, une fonction intéressante serait de permettre d'entrer plusieurs mots clés puis que le système dise pourquoi ils sont ou ne sont pas adaptés à la page.
-

sr - WRInaute passionné

- Messages: 1229
- Inscription: 15 Mai 2003
Bonjour Kalex,
Merci de ton "autorisation" pour mettre ton service sur SEOrapido,
par contre, si tu mets un capcha, cela ne pourra pas fonctionner.
Peux tu me valider le fait que tu va en mettre un ou bien as tu abandonné cette idée ?
A+
Merci de ton "autorisation" pour mettre ton service sur SEOrapido,
par contre, si tu mets un capcha, cela ne pourra pas fonctionner.
Peux tu me valider le fait que tu va en mettre un ou bien as tu abandonné cette idée ?
A+
-

WebRankInfo - Administrateur du site

- Messages: 18964
- Inscription: 19 Avr 2002
bravo kalex c'est intéressant (j'ai aussi un outil interne de ce type). Je ne vois pas bien pourquoi tu te limites aux mots simples (expressions de 1 mot) vu que ce ne sont pas toujours les requêtes qui nous intéressent le plus à travailler en référencement.
Sinon, tu t'es basé sur quoi pour la pondération ?
Sinon, tu t'es basé sur quoi pour la pondération ?
- jcaron
- WRInaute accro

- Messages: 2678
- Inscription: 13 Fév 2004
kalex a écrit:Pour ce qui est de classer les termes par deux ou trois, après avoir travaillé sur la question pendant quelques heures, je pense que classer des mots clés composés de plusieurs mots clés n'a pas de sens, du moins avant la recherche.
Je sais, c'est surprenant, mais prenons un exemple, c'est assez simple. Le blog de Maître Eolas s'intitule "journal d'un avocat". Ce qui est important, c'est "journal" et "avocat", mais ces deux termes sont quand même séparés par deux mots. De plus, "journal" et "droit" serait tout aussi approprié pour une recherche, mais ces deux termes n'apparaissent pas cote à cote. De même pour "avocat" et "blog", "justice" et "droit", etc.
Il y a là deux problématiques différentes: repérer les séquences de mots (donc "journal avocat" par exemple ici) et repérer les combinaisons de mots (donc "blog avocat" par exemple). La deuxième est implicite quand on a la liste des mots individuels, il suffit de faire un produit cartésien de la liste avec elle-même, et de trouver une opération de combinaison du score de chaque (addition ou multiplication a priori). Bref, rien de bien utile en soi, on comprend bien que la combinaison des deux mots les plus "forts" sera plus forte que la combinaison du 100e et du 200e...
Pour la première, je pense que les moteurs font effectivement la différence entre les mots pris de façon isolée dans le texte, et ceux qui se suivent, et c'est pour ça que c'est important (si tu tapes "blog avocat", il va chercher les pages qui contiennent "blog" et "avocat", mais je pense que ceux qui contiennent la séquence "blog avocat" seront privilégiés). En fait j'ai un vague souvenir d'un vieux papier de Google sur le fonctionnement de tout ça (la thèse des deux larrons peut-être?) qui incluait une notion de "proximité" plutôt que de séquence en fait. Pour faire simple, il faut donc repérer les N-grammes, en éliminant évidemment les mots non significatifs ("de", "un"...).
C'est d'ailleurs ce qu'on fait nous:
http://www.oxado.com/bin/checkpage?url= ... -eolas.fr/
Où on constate que les séquences de mots arrivent assez tardivement dans le classement ici (sur d'autres sites ils arrivent beaucoup plus tôt), et que "journal avocat" arrive assez loin.
Clairement on n'a pas du tout la même pondération que toi (d'ailleurs sur un autre exemple je suis arrivé à la conclusion que tu ignores les alt et autres title sur les images... volontaire ou oubli?). Clairement je crois que tout le monde peut être d'accord pour dire que ce n'est pas facile de trouver les "bonnes", aussi bien pour "reproduire" ce que font les moteurs que pour les moteurs eux-mêmes qui doivent fonctionner avec tous les sites, qui ont des structures très différentes
Jacques.
- kalex
- WRInaute discret

- Messages: 241
- Inscription: 14 Sep 2004
jcaron > Merci pour tes conseils ! En fait, j'arrive à peu près aux mêmes conclusions que toi, c'est-à-dire que la proximité de deux termes est importante, mais pas déterminante. Je continue à travailler sur la présentation de plusieurs termes, mais je ne publierais ça que lorsque ça sera satisfaisant.
Je précise tout de même que le but n'est pas d'interpréter toutes les pages, même mal conçues, de façon optimale. Ca, c'est un boulot de moteur de recherche. Le but c'est de déterminer si une page est bien conçue, justement pour faciliter le boulot des moteurs.
Un autre merci pour l'attribut atl des images, la fonction n'était tout simplement pas activée ! Maintenant, ça fonctionne.
WebRankInfo > Pour la pondération, je me suis basé à la fois sur ce que dit le W3C de ses balises et sur l'expérience. Sur une sélection de pages bien référencées et bien conçues, j'ai essayé de faire en sorte que les mots décrivant le mieux la page apparaissent en premier.
sr > Non pas de capcha, plutôt un système de cache de quelques secondes.
Je précise tout de même que le but n'est pas d'interpréter toutes les pages, même mal conçues, de façon optimale. Ca, c'est un boulot de moteur de recherche. Le but c'est de déterminer si une page est bien conçue, justement pour faciliter le boulot des moteurs.
Un autre merci pour l'attribut atl des images, la fonction n'était tout simplement pas activée ! Maintenant, ça fonctionne.
WebRankInfo > Pour la pondération, je me suis basé à la fois sur ce que dit le W3C de ses balises et sur l'expérience. Sur une sélection de pages bien référencées et bien conçues, j'ai essayé de faire en sorte que les mots décrivant le mieux la page apparaissent en premier.
sr > Non pas de capcha, plutôt un système de cache de quelques secondes.
- belgarion
- Nouveau WRInaute

- Messages: 4
- Inscription: 9 Juin 2005
J'utilise le module SEO Quake pour la densité. Quand j'ai vu ton outil, je me suis dit super, il fait la différence entre la pondération d'un malheureux alt et un mot placé dans l'url.
Parcontre les combinaisons de mots n'y sont pas.
Les outils sont donc complémentaires!
Parcontre les combinaisons de mots n'y sont pas.
Les outils sont donc complémentaires!
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Nouvelle étude de WebRankInfo : les mots-clés et le référencement - 04-01-2003
- WebRankInfo lance un forum rédaction et référencement - 17-04-2009
- Outil : analyse de l'historique des backlinks d'un domaine - 24-04-2009
- Lancement de Spider Simulator - 13-06-2004
- Les sites les plus populaires du monde en backlinks - 05-07-2010
- Gérer l'entête HTTP en PHP - 04-08-2008
- Des bons outils pour les spécialistes des Web Analytics - 29-04-2009
- A propos des redirections sauvages (302) - 22-09-2004
- Calculer l'indice de densité
Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page. - Test du code HTTP d'une page
Cet outil vous permet de connaître le code HTTP renvoyé par le serveur pour une page donnée.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités




