Premiere indexation et crawl suivants

WRInaute accro
J'ai remarqué une chose par rapport aux liens internes affichés dans GWT :

Il y a quelque temps j'ai modifier le lien vers ma page mentions légales pour le rendre "mou"
Suite à cela j'ai ajouté de nombreuses pages, toutes avec la nouvelle forme du lien. Le lien n'a été pris en compte pour aucune de ces pages. Très bien, c'était le but.

Mais ce qui est surprenant c'est que les liens des pages qui avaient déjà été indexées avant la modification sont toujours pris en compte. Le compteur dans GWT est resté bloqué. Au bout de 2 mois je pensais qu'il allait commencer à diminuer, mais non.

Je me demande donc si l'indexation ne se fait pas uniquement lors de la première découverte de la page. Elle est disséquée par google et indexée dans son index. Et ensuite google se contente de vérifier si les liens ont changé où s'il n'y a pas de nouveaux liens qui sont arrivés. Comme le texte "mention.html" est toujours présent sur ma page html, mais à un autre endroit, dans du code javascript, est-ce que google pense que le lien est toujours présent et il ne met pas à jour son index ? Pour les nouvelles pages il ne reconnait pas le lien donc rien n'est mis à jour mais pour les anciennes c'est comme si la présence simplement du texte "mention.html" dans la page lui suffisait pour croire que le lien était toujours présent.

Une raison de plus pour faire proprement les pages dès la première fois et ne pas les remodifier par la suite pour les améliorer.
 
Olivier Duffez (admin)
Membre du personnel
je n'ai pas compris ce qui te surprend ? tu te bases sur les liens (backlinks) indiqués dans GWT ?
peux-tu préciser exactement comment tu as fait tes liens "mous" ?
 
WRInaute accro
Dans le footer j'ai remplacé le lien a href par
Code:
<script type="text/javascript" language="javascript">decodemention(); decodemention2();</script>

Dans le premier script je fais un document.write du début du lien et je m'arrête au / qui suite le nom de domaine
Dans le second script je termine l'écriture du lien avec la page, l'ancre et le </a>

Dans GWT je me base sur les liens internes. Pour chaque page google indique le nombre de liens internes pointant vers elle. Pour ma page mentions.html le compteur est resté bloqué et il ne diminue pas. Le nombre de pages est passé de 80 à 138 et les nouvelles pages n'ont pas apportées de liens vers la page mentions.html, le lien est donc bien mou vis-à-vis de google. Mais les anciennes pages qui ne présentent pourtant plus le lien en dur sont toujours comptabilisées. La seule chose qui reste de l'ancien lien c'est l'url relative "mentions.html" qui est présente dans la page, au milieu d'un javascript (c'est même pas dans la page mais dans un fichier .js)
 
Discussions similaires
Haut