Retour vers le futur.. les techniques des 90's marchent

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

jeremie
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 43
Inscription: 25 Fév 2003

Retour vers le futur.. les techniques des 90's marchent

Message le Mar Nov 30, 2004 18:11

Bon,

Si vous allez sur google.com et que vous tapez "lease car" jetez un coupo d'oeuil au numero 2.
Incroyable!! Les locations longues durees aux USA c'est un des marches les plus concurrentiels EX: 10 dollars du click sur Overture 8O
Depuis 3 mois je travaille sur la densite de KW, et aussi le rapprochement des KW par theme. Pour moi ca marche bien et je pense que ca a du sens pour les utilisateurs mais la vraiment je ne comprends pas...

la j'ai le meme mot "lease" repete au moins 1000 fois presqu a la suite et pour tant aux USA Google fait vraiment gaf... En Europe c'est facile de tricher google s'en fou un peu.

Vous avez peut etre une explication?

Jeremie


Madrileño
Madrileño
Madrileño
 
Messages: 28414
Inscription: 7 Juil 2004

Message le Mar Nov 30, 2004 18:21

Si un googleboy passe sur WRI il va lui faire comprendre que c'est pas bien :lol:


rebirth
WRInaute impliqué
WRInaute impliqué
 
Messages: 909
Inscription: 18 Avr 2004

Message le Mar Nov 30, 2004 18:36

Madrileño a écrit:Si un googleboy passe sur WRI il va lui faire comprendre que c'est pas bien :lol:


Comment ca ?!


ybet
WRInaute accro
WRInaute accro
 
Messages: 7700
Inscription: 22 Nov 2003

Message le Mar Nov 30, 2004 18:43

Madrileño a écrit:Si un googleboy passe sur WRI il va lui faire comprendre que c'est pas bien :lol:


Sur un précédant article, Olivier signalait que des membres de google passaient régulièrement sur ce forum ...


scores
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 496
Inscription: 24 Nov 2002

Message le Mar Nov 30, 2004 19:15

Donc à suivre...
si demain il est blacklisté, on saura comment :-))


cariboo
WRInaute impliqué
WRInaute impliqué
 
Messages: 770
Inscription: 8 Fév 2003

Message le Mar Nov 30, 2004 20:33

Bonjour Jérémie...

La plupart des moteurs (pour Google on ne sait pas mais c'est probable aussi) ne raisonnent pas du tout en terme de "densité de mots clés" dans une page, mais, compte tenu de la structure des index, en terme de fréquences de mots clés (term frequency) pondérés par l'inverse de la fréquence des documents contenant le mot clé rapportée à la taille du corpus de documents indexés (inverse document frequency).

Chaque moteur à sa formule magique pour mesurer ce truc. Le résultat, c'est que si une page, même spammy, a la bonne équation en terme de tf*idf ou autre mesure du même genre, et/ou un score cohérent en terme d'indice de co-occurrence de mots clés, ta page peut sortir dans les premières...

Donc je ne suis pas étonné que cette page sorte avec un bon score... Essaie un "keyword stuffing" non naturel avec ce genre de requêtes, et tu vas plonger dans les profondeurs du classement, j'en suis à peu près sûr...
Dernière édition par cariboo le Sam Déc 04, 2004 15:08, édité 1 fois.

lafleur2004
WRInaute passionné
WRInaute passionné
 
Messages: 1651
Inscription: 8 Avr 2004

Message le Mar Nov 30, 2004 22:17

cariboo a écrit:La plupart des moteurs (pour Google on ne sait pas mais c'est probable aussi) ne raisonnent pas du tout en terme de "densité de mots clés" dans une page, mais, compte tenu de la structure des index, en terme de fréquences de mots clés (term frequency) pondérés par l'inverse de la densité mesurée sur la taille du corpus de documents indexés (inverse document frequency).


Salut Cariboo !

J'ai pas compris. Pondérés par quoi ? Qu'est-ce que "l'inverse de la densité mesurée sur la taille du corpus de documents indexés (inverse document frequency)" ? Merci d'avance si tu prends le temps de répondre.

squawk
WRInaute accro
WRInaute accro
 
Messages: 5985
Inscription: 22 Mar 2004

Message le Mar Nov 30, 2004 22:38

La plupart des moteurs (pour Google on ne sait pas mais c'est probable aussi) ne raisonnent pas du tout en terme de "densité de mots clés" dans une page, mais, compte tenu de la structure des index, en terme de fréquences de mots clés (term frequency) pondérés par l'inverse de la densité mesurée sur la taille du corpus de documents indexés (inverse document frequency).


Ben justement vu le doc ca revient au même il devrait être illiminé direct, ca peut pas être naturel autant de keyword en si peu de mots :)

Essaie un "keyword stuffing" non naturel avec ce genre de requêtes, et tu vas plonger dans les profondeurs du classement, j'en suis à peu près sûr...


Y'a pas une notion de texte caché dans le "kyeword stuffing", c'est ce que j'avais cru comprendre ?


Madrileño
Madrileño
Madrileño
 
Messages: 28414
Inscription: 7 Juil 2004

Message le Mar Nov 30, 2004 22:59

ybet a écrit:Sur un précédant article, Olivier signalait que des membres de google passaient régulièrement sur ce forum ...

rebirth > ybet m'a tout à fait compris :lol:

ocsima
WRInaute impliqué
WRInaute impliqué
 
Messages: 602
Inscription: 4 Sep 2004

Message le Mer Déc 01, 2004 4:41

Pour le moteur (la bibliothèque de classes Java) Lucene, voir
http://www.mail-archive.com/lucene-user ... 00060.html
Doug Cutting en est le créateur


cariboo
WRInaute impliqué
WRInaute impliqué
 
Messages: 770
Inscription: 8 Fév 2003

Message le Mer Déc 01, 2004 7:44

Y'a pas une notion de texte caché dans le "kyeword stuffing", c'est ce que j'avais cru comprendre ?


Non, le faire en texte caché est possible, mais ce n'est pas indispensable...

Le "keyword stuffing" ("bourrage de mots clés") consiste à répéter de manière artificielle dans une page les mots clés sur lesquels on souhaite faire référencer sa page, pour sortir en premier. Comme l'ont souligné certains, cette pratique a eu son heure de gloire... Sauf que cela fait belle lurette que les moteurs ont appris à ne pas réagir bêtement en mettant en avant de telles pages...

J'ai pas compris. Pondérés par quoi ? Qu'est-ce que "l'inverse de la densité mesurée sur la taille du corpus de documents indexés (inverse document frequency)" ? Merci d'avance si tu prends le temps de répondre.


J'ai dit inverse de la densité ? Zut, c'est un lapsus, c'est l'inverse de la fréquence...

Pour faire court, si on mesure seulement la fréquence des mots clés dans une page, et si on classe les mots clés présents par fréquence, ce qui sort en premier, ce ne sont pas forcément les mots clés qui révèlent de quoi parle la page, mais plutôt les articles comme "de, le etc...".

Pour éviter ce biais, on calcule la fréquence des pages contenant les mots clés dans tout le corpus (corpus=l'ensemble des pages indéxées par le moteur, dans la pratique un échantillon suffisamment volumineux représentatif de ces pages suffit). Sur tout le corpus, les mots comme "de, le , pas, est" etc... sont présents dans les pages avec une fréquence élevée, beaucoup plus élevée que les mots qui caractérisent le contenu d'une page isolée...

Donc, si on classe les pages non pas en fonction de la seule fréquence des mots clés, mais en fonction de cette fréquence multipliée par l'inverse de la fréquence des pages contenants ces mots clés dans le corpus, cette fois ci, ce qui sort en premier, ce sont les mots clés vraiment caractéristiques d'une page donnée.

Dès qu'un moteur utilise une mesure à la "tf*idf", le résultat c'est que le keyword stuffing marche de manière très différente d'une requête à l'autre...

Reste que sur des moteurs sophistiqués, la co-occurrence des termes et la proximité ont aussi une influence...
Dernière édition par cariboo le Sam Déc 04, 2004 15:11, édité 1 fois.

ocsima
WRInaute impliqué
WRInaute impliqué
 
Messages: 602
Inscription: 4 Sep 2004

Message le Mer Déc 01, 2004 7:56

Sauf que les 'mots vides' : le, la, de, ... ne sont 'généralement) pas dans l'index
Ils sont (en général) sautés lors de l'indexation des pages et non pris en compte dans la requête, à une nuance près : il existe quelque chose entre les mots, quoi exactement ?


e-kiwi
Modérateur
Modérateur
 
Messages: 15618
Inscription: 23 Déc 2003

Message le Mer Déc 01, 2004 8:39

il y a une partie "humaine" chez google ? je pensais que c etait des ordinateurs gérés comme des ordinateurs moi :-)

lafleur2004
WRInaute passionné
WRInaute passionné
 
Messages: 1651
Inscription: 8 Avr 2004

Message le Mer Déc 01, 2004 9:01

Ca y est, j'ai pigé (enfin, je crois 8) ), merci Cariboo !


haderach
WRInaute impliqué
WRInaute impliqué
 
Messages: 870
Inscription: 26 Aoû 2004

Message le Mer Déc 01, 2004 9:11

cariboo a écrit:

Donc, si on classe les pages non pas en fonction de seule fréquence des mots clés, mais en fonction de cette fréquence multipliée par l'inverse de la fréquence des mots clés dans le corpus, cette fois ci, ce qui sort en premier, ce sont les mots clés vraiment caractéristiques d'une page donnée.



Ceci signifie que si on crée une page qui n'a aucun rapport avec le site (ou éloigné avec le sujet), même en bourrant la page de mot clés, celle-ci sera très mal référencée?

Si c'est la cas, comment des sites généralistes peuvent-ils tirer leur épingle du jeu?

Enfin, à quoi correspondent les terme de la formule dont tu parle?

Merci d'avance pour cet éclairage!!

Retour vers le futur.. les techniques des 90's marchent

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités