Un peu plus qu'un analyseur de densité
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Pour ceux qui m'avaient demandé de rendre publiques les pondérations effectuées, je commence avec cette petite page où je pense avoir listé les variables les plus importantes : http://alyze.info/InternalVars
Permettre aux utilisateurs de les modifier serait surement intéressant...
C'est la deuxième "fonctionnalité" que je crée grâce à vos suggestions. Merci.
Permettre aux utilisateurs de les modifier serait surement intéressant...
C'est la deuxième "fonctionnalité" que je crée grâce à vos suggestions. Merci.
kalex a écrit:Pour ceux qui m'avaient demandé de rendre publiques les pondérations effectuées, je commence avec cette petite page où je pense avoir listé les variables les plus importantes : http://alyze.info/InternalVars
Permettre aux utilisateurs de les modifier serait surement intéressant...
C'est la deuxième "fonctionnalité" que je crée grâce à vos suggestions. Merci.
bien vu.
Ca correspond à la balise title ?Poids du titre (par défaut) : 13
Oui, c'est bien le <title>.
Là j'avais plusieurs choix, soit pondérer le titre et les métas comme des balises ordinaires, soit leur attribuer un poids par rapport au body. J'obtiens de meilleurs résultats avec cette dernière technique, mais ça pourra éventuellement faire l'objet d'une option lorsque les utilisateurs pourront définir eux-mêmes leurs critères (j'ai parlé au futur ? merde maintenant, il faut que je le code
).
Là j'avais plusieurs choix, soit pondérer le titre et les métas comme des balises ordinaires, soit leur attribuer un poids par rapport au body. J'obtiens de meilleurs résultats avec cette dernière technique, mais ça pourra éventuellement faire l'objet d'une option lorsque les utilisateurs pourront définir eux-mêmes leurs critères (j'ai parlé au futur ? merde maintenant, il faut que je le code
As-tu essayé de faire une corrélation entre ton outil et des classements présent sur Google (notamment pour la pondération) ? Où c'est plutôt à la louche ?
Je demande ça, parce que je ne vois pas l'intérêt d'un tel outil. Ou plutôt, je vois difficilement comment appliquer une telle méthode à chaque page d'un site, à moins d'avoir vraiment beaucoup de temps sur chaque page créé. Sachant qu'en plus, personne ne peut dire ce qui est optimal.
Je demande ça, parce que je ne vois pas l'intérêt d'un tel outil. Ou plutôt, je vois difficilement comment appliquer une telle méthode à chaque page d'un site, à moins d'avoir vraiment beaucoup de temps sur chaque page créé. Sachant qu'en plus, personne ne peut dire ce qui est optimal.
Tout est sur le site : "Ce classement ne vise pas à reproduire le comportement de tel ou tel moteur de recherche. Il s'agit plutôt d'une analyse (forcément subjective) produite avec un grand souci de rigueur et de bon sens."
Pour ce qui est de classer les termes par deux ou trois, après avoir travaillé sur la question pendant quelques heures, je pense que classer des mots clés composés de plusieurs mots clés n'a pas de sens, du moins avant la recherche.
Je sais, c'est surprenant, mais prenons un exemple, c'est assez simple. Le blog de Maître Eolas s'intitule "journal d'un avocat". Ce qui est important, c'est "journal" et "avocat", mais ces deux termes sont quand même séparés par deux mots. De plus, "journal" et "droit" serait tout aussi approprié pour une recherche, mais ces deux termes n'apparaissent pas cote à cote. De même pour "avocat" et "blog", "justice" et "droit", etc.
Si je veux classer les mots clés par deux ou trois, il me faut absolument des statistiques de recherche. Et je n'en ai malheureusement pas (Google si tu me lis, j'ai 120 Go de libres sur mon disque
).
Sinon, une fonction intéressante serait de permettre d'entrer plusieurs mots clés puis que le système dise pourquoi ils sont ou ne sont pas adaptés à la page.
Je sais, c'est surprenant, mais prenons un exemple, c'est assez simple. Le blog de Maître Eolas s'intitule "journal d'un avocat". Ce qui est important, c'est "journal" et "avocat", mais ces deux termes sont quand même séparés par deux mots. De plus, "journal" et "droit" serait tout aussi approprié pour une recherche, mais ces deux termes n'apparaissent pas cote à cote. De même pour "avocat" et "blog", "justice" et "droit", etc.
Si je veux classer les mots clés par deux ou trois, il me faut absolument des statistiques de recherche. Et je n'en ai malheureusement pas (Google si tu me lis, j'ai 120 Go de libres sur mon disque
Sinon, une fonction intéressante serait de permettre d'entrer plusieurs mots clés puis que le système dise pourquoi ils sont ou ne sont pas adaptés à la page.
Bonjour Kalex,
Merci de ton "autorisation" pour mettre ton service sur SEOrapido,
par contre, si tu mets un capcha, cela ne pourra pas fonctionner.
Peux tu me valider le fait que tu va en mettre un ou bien as tu abandonné cette idée ?
A+
Merci de ton "autorisation" pour mettre ton service sur SEOrapido,
par contre, si tu mets un capcha, cela ne pourra pas fonctionner.
Peux tu me valider le fait que tu va en mettre un ou bien as tu abandonné cette idée ?
A+
-

WebRankInfo - Administrateur du site

- Messages: 15914
- Inscription: Ven Avr 19, 2002 19:51
bravo kalex c'est intéressant (j'ai aussi un outil interne de ce type). Je ne vois pas bien pourquoi tu te limites aux mots simples (expressions de 1 mot) vu que ce ne sont pas toujours les requêtes qui nous intéressent le plus à travailler en référencement.
Sinon, tu t'es basé sur quoi pour la pondération ?
Sinon, tu t'es basé sur quoi pour la pondération ?
kalex a écrit:Pour ce qui est de classer les termes par deux ou trois, après avoir travaillé sur la question pendant quelques heures, je pense que classer des mots clés composés de plusieurs mots clés n'a pas de sens, du moins avant la recherche.
Je sais, c'est surprenant, mais prenons un exemple, c'est assez simple. Le blog de Maître Eolas s'intitule "journal d'un avocat". Ce qui est important, c'est "journal" et "avocat", mais ces deux termes sont quand même séparés par deux mots. De plus, "journal" et "droit" serait tout aussi approprié pour une recherche, mais ces deux termes n'apparaissent pas cote à cote. De même pour "avocat" et "blog", "justice" et "droit", etc.
Il y a là deux problématiques différentes: repérer les séquences de mots (donc "journal avocat" par exemple ici) et repérer les combinaisons de mots (donc "blog avocat" par exemple). La deuxième est implicite quand on a la liste des mots individuels, il suffit de faire un produit cartésien de la liste avec elle-même, et de trouver une opération de combinaison du score de chaque (addition ou multiplication a priori). Bref, rien de bien utile en soi, on comprend bien que la combinaison des deux mots les plus "forts" sera plus forte que la combinaison du 100e et du 200e...
Pour la première, je pense que les moteurs font effectivement la différence entre les mots pris de façon isolée dans le texte, et ceux qui se suivent, et c'est pour ça que c'est important (si tu tapes "blog avocat", il va chercher les pages qui contiennent "blog" et "avocat", mais je pense que ceux qui contiennent la séquence "blog avocat" seront privilégiés). En fait j'ai un vague souvenir d'un vieux papier de Google sur le fonctionnement de tout ça (la thèse des deux larrons peut-être?) qui incluait une notion de "proximité" plutôt que de séquence en fait. Pour faire simple, il faut donc repérer les N-grammes, en éliminant évidemment les mots non significatifs ("de", "un"...).
C'est d'ailleurs ce qu'on fait nous:
http://www.oxado.com/bin/checkpage?url= ... -eolas.fr/
Où on constate que les séquences de mots arrivent assez tardivement dans le classement ici (sur d'autres sites ils arrivent beaucoup plus tôt), et que "journal avocat" arrive assez loin.
Clairement on n'a pas du tout la même pondération que toi (d'ailleurs sur un autre exemple je suis arrivé à la conclusion que tu ignores les alt et autres title sur les images... volontaire ou oubli?). Clairement je crois que tout le monde peut être d'accord pour dire que ce n'est pas facile de trouver les "bonnes", aussi bien pour "reproduire" ce que font les moteurs que pour les moteurs eux-mêmes qui doivent fonctionner avec tous les sites, qui ont des structures très différentes
Jacques.
jcaron > Merci pour tes conseils ! En fait, j'arrive à peu près aux mêmes conclusions que toi, c'est-à-dire que la proximité de deux termes est importante, mais pas déterminante. Je continue à travailler sur la présentation de plusieurs termes, mais je ne publierais ça que lorsque ça sera satisfaisant.
Je précise tout de même que le but n'est pas d'interpréter toutes les pages, même mal conçues, de façon optimale. Ca, c'est un boulot de moteur de recherche. Le but c'est de déterminer si une page est bien conçue, justement pour faciliter le boulot des moteurs.
Un autre merci pour l'attribut atl des images, la fonction n'était tout simplement pas activée ! Maintenant, ça fonctionne.
WebRankInfo > Pour la pondération, je me suis basé à la fois sur ce que dit le W3C de ses balises et sur l'expérience. Sur une sélection de pages bien référencées et bien conçues, j'ai essayé de faire en sorte que les mots décrivant le mieux la page apparaissent en premier.
sr > Non pas de capcha, plutôt un système de cache de quelques secondes.
Je précise tout de même que le but n'est pas d'interpréter toutes les pages, même mal conçues, de façon optimale. Ca, c'est un boulot de moteur de recherche. Le but c'est de déterminer si une page est bien conçue, justement pour faciliter le boulot des moteurs.
Un autre merci pour l'attribut atl des images, la fonction n'était tout simplement pas activée ! Maintenant, ça fonctionne.
WebRankInfo > Pour la pondération, je me suis basé à la fois sur ce que dit le W3C de ses balises et sur l'expérience. Sur une sélection de pages bien référencées et bien conçues, j'ai essayé de faire en sorte que les mots décrivant le mieux la page apparaissent en premier.
sr > Non pas de capcha, plutôt un système de cache de quelques secondes.
J'utilise le module SEO Quake pour la densité. Quand j'ai vu ton outil, je me suis dit super, il fait la différence entre la pondération d'un malheureux alt et un mot placé dans l'url.
Parcontre les combinaisons de mots n'y sont pas.
Les outils sont donc complémentaires!
Parcontre les combinaisons de mots n'y sont pas.
Les outils sont donc complémentaires!
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- L'indice de densité idéal pour le référencement
- WebRankInfo lance un forum rédaction et référencement
- Outil de référencement SEO Playground Tool
- Outil : analyse de l'historique des backlinks d'un domaine
- Lancement de Spider Simulator
- Search Engine Strategies - Londres
- Traitement des mots par Google et notions linguistiques
- Les bonnes stratégies de mots-clés pour le référencement
- Gérer l'entête HTTP en PHP
- Des bons outils pour les spécialistes des Web Analytics
- Analyseur de log
- Analyseur de liens
- Analyseur de visites
- Analyseur de site web
- Cherche analyseur de log
- Analyseur de log anlgform d'Analog
- Creation d'un bot analyseur
- Cherche un bon analyseur de logs
- Création d'un Analyseur de logs
- Quel analyseur de log (stat) utilisez vous ?
- Analyseur de page et calcul de la vitesse d'affichage
- Analyseur de taux d'audiance SGBB sans les logs Apache ?
- Analyseur d'entête HTTP (HTTP Header)
- Test du code HTTP d'une page
Cet outil vous permet de connaître le code HTTP renvoyé par le serveur pour une page donnée. - Calculer l'indice de densité
Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités









le forum