La recherche google par segment de phrase

WRInaute accro
Bonjour,

En relation avec mon post : (https://www.webrankinfo.com/forum/t/lintegrite-de-google-panda.166370/) mais j'ai ouvert un autre post car il est lié à ma même séries de tests mais là, je ne parle pas de panda mais plutôt en amont, de la façon dont google traite le contenu d'une page.

En faite, en continuant mes recherches de DC "on-page" sur GG, je me suis aperçu bêtement que j'avais commis une faute de frappe sur une phrase de 260 car. Corrigeant cette vilaine faute, j'ai relancé une recherche avec la phrase corrigée.
Et là... mon url qui était donné en pôle-position n'est plus ??!!

Simplement pour un et unique caractère changé sur une phrase de 260 car. !

Ce que j'en conclus... google doit travaillé comme les poupées russes !
ETAPE 1 : crawler et indexer la page dans un data server maitre.
ETAPE 2 : dans ce data server maitre, il va répertorier les phrases avec pour séparateur la ponctuation pour le mettre dans un data serveur secondaire.
ETAPE 3: depuis le data serveur secondaire, il va extraire chaque mot avec pour séparateur l'espace pour le mettre dans un data serveur tertiaire.

Ensuite dans le résultat des serps, il ira tout d'abord vérifier que la phrase est existante en faisant la corrélation entre les diffèrents data-center (1, 2 et 3) par pourcentage d’occurrence.

Biensur, c'est grandement schématisé looool mais cela expliquerait pourquoi un seul caractère changé va impacter le résultat même sur une phrase de 260 car. !!

Mais cela ferait aussi sous-entendre que changer un seul caractère, peut changer le position d'une page dans les serps ! Cela donnerait encore plus de force à faire attention à la façon dont son texte est écrit !

Votre avis ?

PS : Cette réflexion vient de cette coïncidence avec cette faute mais pour d'autres phrases, j'ai changé un mot, un caractère mais mon url restait en pôle-position.
Je trouve ça tout de même intéressant à creuser, pas vous?
 
WRInaute accro
déjà, une recherche de 260 car c'est anecdotique : dans 99% des cas ce ne sont que des recherches de webmasters et surtout pas d'internaute.
 
WRInaute accro
oui bien sur lol :)

Mais tu auras compris que je parle d'un test occurrence sur une recherche comportant plusieurs mots pour restreindre les résultats et ainsi faire ressortir sa page web parce que normalement, ce qui valide un résultat, c'est le taux d’occurrence dans une page surtout si celle-ci se trouve issue d'une même phrase, je pense !
 
WRInaute accro
non, ça fait longtemps que gg ne tient plus compte, sauf de façon anecdotique, du taux d’occurrence des mots. Sauf, peut-être, de façon négative : si trop forte occurrence, site marqué comme spam donc descente dans les serp
 
WRInaute accro
Pas tout compris mais un petit rappel quand même.

Si je tape comme recherche: élevage de lézard suisses en milieu urbain -> Google va d'abord essayer de trouver les pages qui reprennent l'ensemble de ces mots (sauf de et en trop petit). Une page avec une phrase du genre je faisais le lézard au soleil en regardant l'élevage de vaches suisses peintes en bleu, en pensant à ma vie en milieu urbain va passer. Ensuite, il va regarder des synonymes (genre ma vie urbaine quotidienne) mais aussi plus large (restaurant est depuis des années assimilé à restaurateur). Ceci explique tes constatations.

Mais, petit rappel, pour analyser le DC, la solution est de taper la recherche entre "". Exemple
la recherche
Code:
élevage de lézard urbain
va renvoyer la phrase ci-dessus
et "élevage de lézard urbain" ne la renvoit pas ... entre "", c'est la suite des mots qui doit être strictement identique ... C'est valable dans du code html (et dérivé php, asp,, ...) mais bizarrement pas dans les fichiers pdf .
 
Discussions similaires
Haut