Retour vers le futur.. les techniques des 90's marchent
63 messages
• Page 1 sur 5 • 1, 2, 3, 4, 5
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- jeremie
- Nouveau WRInaute

- Messages: 43
- Inscription: 25 Fév 2003
Retour vers le futur.. les techniques des 90's marchent
Bon,
Si vous allez sur google.com et que vous tapez "lease car" jetez un coupo d'oeuil au numero 2.
Incroyable!! Les locations longues durees aux USA c'est un des marches les plus concurrentiels EX: 10 dollars du click sur Overture
Depuis 3 mois je travaille sur la densite de KW, et aussi le rapprochement des KW par theme. Pour moi ca marche bien et je pense que ca a du sens pour les utilisateurs mais la vraiment je ne comprends pas...
la j'ai le meme mot "lease" repete au moins 1000 fois presqu a la suite et pour tant aux USA Google fait vraiment gaf... En Europe c'est facile de tricher google s'en fou un peu.
Vous avez peut etre une explication?
Jeremie
Si vous allez sur google.com et que vous tapez "lease car" jetez un coupo d'oeuil au numero 2.
Incroyable!! Les locations longues durees aux USA c'est un des marches les plus concurrentiels EX: 10 dollars du click sur Overture
Depuis 3 mois je travaille sur la densite de KW, et aussi le rapprochement des KW par theme. Pour moi ca marche bien et je pense que ca a du sens pour les utilisateurs mais la vraiment je ne comprends pas...
la j'ai le meme mot "lease" repete au moins 1000 fois presqu a la suite et pour tant aux USA Google fait vraiment gaf... En Europe c'est facile de tricher google s'en fou un peu.
Vous avez peut etre une explication?
Jeremie
-

cariboo - WRInaute impliqué

- Messages: 770
- Inscription: 8 Fév 2003
Bonjour Jérémie...
La plupart des moteurs (pour Google on ne sait pas mais c'est probable aussi) ne raisonnent pas du tout en terme de "densité de mots clés" dans une page, mais, compte tenu de la structure des index, en terme de fréquences de mots clés (term frequency) pondérés par l'inverse de la fréquence des documents contenant le mot clé rapportée à la taille du corpus de documents indexés (inverse document frequency).
Chaque moteur à sa formule magique pour mesurer ce truc. Le résultat, c'est que si une page, même spammy, a la bonne équation en terme de tf*idf ou autre mesure du même genre, et/ou un score cohérent en terme d'indice de co-occurrence de mots clés, ta page peut sortir dans les premières...
Donc je ne suis pas étonné que cette page sorte avec un bon score... Essaie un "keyword stuffing" non naturel avec ce genre de requêtes, et tu vas plonger dans les profondeurs du classement, j'en suis à peu près sûr...
La plupart des moteurs (pour Google on ne sait pas mais c'est probable aussi) ne raisonnent pas du tout en terme de "densité de mots clés" dans une page, mais, compte tenu de la structure des index, en terme de fréquences de mots clés (term frequency) pondérés par l'inverse de la fréquence des documents contenant le mot clé rapportée à la taille du corpus de documents indexés (inverse document frequency).
Chaque moteur à sa formule magique pour mesurer ce truc. Le résultat, c'est que si une page, même spammy, a la bonne équation en terme de tf*idf ou autre mesure du même genre, et/ou un score cohérent en terme d'indice de co-occurrence de mots clés, ta page peut sortir dans les premières...
Donc je ne suis pas étonné que cette page sorte avec un bon score... Essaie un "keyword stuffing" non naturel avec ce genre de requêtes, et tu vas plonger dans les profondeurs du classement, j'en suis à peu près sûr...
Dernière édition par cariboo le Sam Déc 04, 2004 15:08, édité 1 fois.
- lafleur2004
- WRInaute passionné

- Messages: 1651
- Inscription: 8 Avr 2004
cariboo a écrit:La plupart des moteurs (pour Google on ne sait pas mais c'est probable aussi) ne raisonnent pas du tout en terme de "densité de mots clés" dans une page, mais, compte tenu de la structure des index, en terme de fréquences de mots clés (term frequency) pondérés par l'inverse de la densité mesurée sur la taille du corpus de documents indexés (inverse document frequency).
Salut Cariboo !
J'ai pas compris. Pondérés par quoi ? Qu'est-ce que "l'inverse de la densité mesurée sur la taille du corpus de documents indexés (inverse document frequency)" ? Merci d'avance si tu prends le temps de répondre.
- squawk
- WRInaute accro

- Messages: 5985
- Inscription: 22 Mar 2004
La plupart des moteurs (pour Google on ne sait pas mais c'est probable aussi) ne raisonnent pas du tout en terme de "densité de mots clés" dans une page, mais, compte tenu de la structure des index, en terme de fréquences de mots clés (term frequency) pondérés par l'inverse de la densité mesurée sur la taille du corpus de documents indexés (inverse document frequency).
Ben justement vu le doc ca revient au même il devrait être illiminé direct, ca peut pas être naturel autant de keyword en si peu de mots
Essaie un "keyword stuffing" non naturel avec ce genre de requêtes, et tu vas plonger dans les profondeurs du classement, j'en suis à peu près sûr...
Y'a pas une notion de texte caché dans le "kyeword stuffing", c'est ce que j'avais cru comprendre ?
- ocsima
- WRInaute impliqué

- Messages: 602
- Inscription: 4 Sep 2004
Pour le moteur (la bibliothèque de classes Java) Lucene, voir
http://www.mail-archive.com/lucene-user ... 00060.html
Doug Cutting en est le créateur
http://www.mail-archive.com/lucene-user ... 00060.html
Doug Cutting en est le créateur
-

cariboo - WRInaute impliqué

- Messages: 770
- Inscription: 8 Fév 2003
Y'a pas une notion de texte caché dans le "kyeword stuffing", c'est ce que j'avais cru comprendre ?
Non, le faire en texte caché est possible, mais ce n'est pas indispensable...
Le "keyword stuffing" ("bourrage de mots clés") consiste à répéter de manière artificielle dans une page les mots clés sur lesquels on souhaite faire référencer sa page, pour sortir en premier. Comme l'ont souligné certains, cette pratique a eu son heure de gloire... Sauf que cela fait belle lurette que les moteurs ont appris à ne pas réagir bêtement en mettant en avant de telles pages...
J'ai pas compris. Pondérés par quoi ? Qu'est-ce que "l'inverse de la densité mesurée sur la taille du corpus de documents indexés (inverse document frequency)" ? Merci d'avance si tu prends le temps de répondre.
J'ai dit inverse de la densité ? Zut, c'est un lapsus, c'est l'inverse de la fréquence...
Pour faire court, si on mesure seulement la fréquence des mots clés dans une page, et si on classe les mots clés présents par fréquence, ce qui sort en premier, ce ne sont pas forcément les mots clés qui révèlent de quoi parle la page, mais plutôt les articles comme "de, le etc...".
Pour éviter ce biais, on calcule la fréquence des pages contenant les mots clés dans tout le corpus (corpus=l'ensemble des pages indéxées par le moteur, dans la pratique un échantillon suffisamment volumineux représentatif de ces pages suffit). Sur tout le corpus, les mots comme "de, le , pas, est" etc... sont présents dans les pages avec une fréquence élevée, beaucoup plus élevée que les mots qui caractérisent le contenu d'une page isolée...
Donc, si on classe les pages non pas en fonction de la seule fréquence des mots clés, mais en fonction de cette fréquence multipliée par l'inverse de la fréquence des pages contenants ces mots clés dans le corpus, cette fois ci, ce qui sort en premier, ce sont les mots clés vraiment caractéristiques d'une page donnée.
Dès qu'un moteur utilise une mesure à la "tf*idf", le résultat c'est que le keyword stuffing marche de manière très différente d'une requête à l'autre...
Reste que sur des moteurs sophistiqués, la co-occurrence des termes et la proximité ont aussi une influence...
Dernière édition par cariboo le Sam Déc 04, 2004 15:11, édité 1 fois.
- ocsima
- WRInaute impliqué

- Messages: 602
- Inscription: 4 Sep 2004
Sauf que les 'mots vides' : le, la, de, ... ne sont 'généralement) pas dans l'index
Ils sont (en général) sautés lors de l'indexation des pages et non pris en compte dans la requête, à une nuance près : il existe quelque chose entre les mots, quoi exactement ?
Ils sont (en général) sautés lors de l'indexation des pages et non pris en compte dans la requête, à une nuance près : il existe quelque chose entre les mots, quoi exactement ?
- lafleur2004
- WRInaute passionné

- Messages: 1651
- Inscription: 8 Avr 2004
Ca y est, j'ai pigé (enfin, je crois
), merci Cariboo !
-

haderach - WRInaute impliqué

- Messages: 870
- Inscription: 26 Aoû 2004
cariboo a écrit:
Donc, si on classe les pages non pas en fonction de seule fréquence des mots clés, mais en fonction de cette fréquence multipliée par l'inverse de la fréquence des mots clés dans le corpus, cette fois ci, ce qui sort en premier, ce sont les mots clés vraiment caractéristiques d'une page donnée.
Ceci signifie que si on crée une page qui n'a aucun rapport avec le site (ou éloigné avec le sujet), même en bourrant la page de mot clés, celle-ci sera très mal référencée?
Si c'est la cas, comment des sites généralistes peuvent-ils tirer leur épingle du jeu?
Enfin, à quoi correspondent les terme de la formule dont tu parle?
Merci d'avance pour cet éclairage!!
63 messages
• Page 1 sur 5 • 1, 2, 3, 4, 5
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Les techniques bourrines marchent toujours aussi bien
- PageRank: Retour vers le Futur !
- [Bug Google News] Retour vers le futur
- widgets Kelkoo : marchent plus?
- CGI qui ne marchent plus
- Certaines redirections marchent et d'autres non
- les thèmes qui marchent
- Référencement : les méthodes qui marchent !
- Pourquoi mes slahes ne marchent-ils pas ?
- Attention Bug Adsense les scripts ne marchent plus
- Suite de l'interview avec Google - 24-06-2002
- L'annuaire WebRankInfo : inscription gratuite SANS lien retour exigé - 05-12-2007
- Le futur du moteur de recherche vu par les Français - 21-01-2010
- Liste de bons annuaires - 06-01-2005
- Google HomePage API : Google se met aux widgets - 19-12-2005
- Un nouveau data center pour Google en Caroline du Nord - 23-01-2007
- Google va créer une unité de recherche en Inde - 13-12-2003
- Comment éviter de se faire voler son nom de domaine... - 21-03-2008
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités






