desindexation massive

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics


cariboo
WRInaute impliqué
WRInaute impliqué
 
Messages: 770
Inscription: 8 Fév 2003

Message le Lun Sep 06, 2004 18:20

Il me semble que sous les pages désindexées par Google et qui s'affichent sans description, Google ajoute toujours "page similaire"


Il y'a pratiquement toujours page similaire aussi sur les pages indexées normalement C''est surtout la présence très fréquente de "résultat complémentaire" qui est le plus intéressant.

Les débats se concentrent actuellement sur la supposition que les mauvais Backlinks sont la source de la désindexation des pages, subie pendant la révision des BL de Juillet et Aout.


Il n'y a pas à proprement parler de "désindexation", mais soit :
- une non réindexation : des pages listées ne sont pas remises à jour... le contenu disponible est un contenu ancien, accessible par le lien "résultat complémentaire"
- une non indexation : des pages sont listées, mais pas crawlées... volontairement
- une non indexation accidentelle : des pages n'ont pas pu être crawlées pour des raisons techniques (on retrouve alors les cas connus autrefois)

Je pense que c'est une mauvaise approche de prendre ce phénomène comme une pénalité classique...

Une trop grande ressemblance entre des pages serait il aussi un sujet suceptible de désindexer


Disons que Google a décidé de ne pas indexer complétement les sites dont le contenu est jugé "non prioritaire"... Certaines pages dynamiques sont dans le collimateur... Et oui, certains types de contenu répétitifs sont considérés comme non prioritaires à indexer.

L'importance des pages peut être calculée à partir notamment de l'un des facteurs suivants :
- fréquence de mise à jour d'une page
- fréquence de mise à jour dans un domaine donné
- notes données par le croisement des taux de similarités entre les termes contenus dans la page et les requêtes réellement tapées dans le moteur
- nombre de backlinks
- pagerank
- note en tant que hub (prend en compte les liens sortants)
- critères liés au contenu de l'url (dommage pour les pages dynamiques, et les pages perso, dommage aussi pour les pages à trois clics de la page index)
- liste non exhaustive...

Notez bien que je ne sais pas quels sont les critères réellement utilisés par Google. Mais il est clair qu'ils utilisent un système de crawl optimisé sur un index ouvert, avec priorité donnée aux pages jugées les plus importantes. Les critères indiqués ici sont les plus communément expérimentés, ont les retrouve dans les articles de Cho et Molina, qui sont connus pour avoir aidés Google à améliorer leur bot (ils sont de l'Université de Stanford)

Je ne sais pas si l'existence de pages dupliquées, ou semi-dupliquées, est un critère opérationnel, ou juste la conséquence d'autres critères.

desindexation massive

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité