Comment savoir les page en duplicate content ?
7 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
-

Thierry Bugs - WRInaute accro

- Messages: 4369
- Inscription: Mer Juin 16, 2004 0:15
un bon truc c'est de regarder les pages dans google :
site:monsite.com
celles qui ne sont pas en cache ou celles qui se trouvent en "résultat complémentaires" ont un problème
soit du duplicate, soit métas similaires... au cas par cas
site:monsite.com
celles qui ne sont pas en cache ou celles qui se trouvent en "résultat complémentaires" ont un problème
soit du duplicate, soit métas similaires... au cas par cas
-

Megachercheur - WRInaute impliqué

- Messages: 468
- Inscription: Sam Oct 23, 2004 16:45
Thierry Bugs a écrit:un bon truc c'est de regarder les pages dans google :
site:monsite.com
Oui je fais pareil. Par contre sur un site, j'ai des pages qui ne sont ni "sans cache", ni en Résultat complémentaire : elles sont invisibles. Par exemple avec la commande site j'ai 50 pages qui sont annoncées. Mettons que j'en ai 40 considérés comme pertinentes. Je relance alors la recherche (filter=0) et Google m'en sort 5 de plus (3 sans cache et 2 en Résultat complémentaire). Au-delà, plus rien ! Pourtant en théorie il en manque 5 autres ! J'aimerai bien finir de faire le ménage, mais comment les identifier ?
-

Thierry Bugs - WRInaute accro

- Messages: 4369
- Inscription: Mer Juin 16, 2004 0:15
Non en liste noire c'est tout le site pas quelques pages.
Par contre, gg peut ne pas les trouver, c'est d'ailleurs à mon avis, l'intérêt du sitemap xml (mais c'est aussi ses limites : connaître ne fait pas apprécier).
Il est possible aussi qu'une page n'ait pas de valeur, elle mettra du temps à en prendre.
Mais justement celles qui n'apparaissent pas, se sont souvent celles là en duplicate content.
"une page sur 259" : aucune importance
5 sur 50 pages c'est pareil.
Parfois le crawl au fond des sites met des mois...
Le temps joue pour vous.
Le véritable problème du duplicate c'est quand c'est un nombre important de pages du site genre 30%, 50%. Car là c'est un problème plus profond, où des tas de choses sont à revoir.
Dernièrement sur un site français traduit en anglais, j'ai dû changer totalement les templates, les noms des répertoires, tout ce qui était possible pour le sortir du duplicate : google ne le crawlait pas du tout, au bout d'une semaine de ces changements, il est venu un peu, mais pas correctement !!
En fait j'ai compris ensuite, j'avais mis dans le .htaccess un répertoire qu'il ne pouvait pas crawler et où il croyait qu'il y avait des pages.
Du jour où je l'ai autorisé à visiter ce répertoire : tout est parti correctement...
C'est une "bête machine", souvent le duplicate c'est de notre faute
Par contre, gg peut ne pas les trouver, c'est d'ailleurs à mon avis, l'intérêt du sitemap xml (mais c'est aussi ses limites : connaître ne fait pas apprécier).
Il est possible aussi qu'une page n'ait pas de valeur, elle mettra du temps à en prendre.
Mais justement celles qui n'apparaissent pas, se sont souvent celles là en duplicate content.
"une page sur 259" : aucune importance
5 sur 50 pages c'est pareil.
Parfois le crawl au fond des sites met des mois...
Le temps joue pour vous.
Le véritable problème du duplicate c'est quand c'est un nombre important de pages du site genre 30%, 50%. Car là c'est un problème plus profond, où des tas de choses sont à revoir.
Dernièrement sur un site français traduit en anglais, j'ai dû changer totalement les templates, les noms des répertoires, tout ce qui était possible pour le sortir du duplicate : google ne le crawlait pas du tout, au bout d'une semaine de ces changements, il est venu un peu, mais pas correctement !!
En fait j'ai compris ensuite, j'avais mis dans le .htaccess un répertoire qu'il ne pouvait pas crawler et où il croyait qu'il y avait des pages.
Du jour où je l'ai autorisé à visiter ce répertoire : tout est parti correctement...
C'est une "bête machine", souvent le duplicate c'est de notre faute
-

Megachercheur - WRInaute impliqué

- Messages: 468
- Inscription: Sam Oct 23, 2004 16:45
Thierry Bugs a écrit:celles qui n'apparaissent pas, se sont souvent celles là en duplicate content.
Oui c'est ce que je me dis. En fait c'était à la grande époque où le PR toolbar donnait des frissons
J'avais supprimé des pages de ce site, mais pour ne pas "perdre le PR" (que celui qui n'a jamais pensé à faire ça me jette la première pierre
Mais ça fait vraiment longtemps (plus d'un an) que j'ai supprimé ces pages vides, et visiblement le père Google a encore ces saletés dans son index. Or comment les supprimer (par erreur 410 ou robots.txt) si je ne connais pas les noms de ces pages
7 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Comment éviter les contenus dupliqués (avec/sans le www)
- link rel=canonical pour réduire les contenus dupliqués
- Formation au référencement Internet plébiscitée : Ranking Metrics
- Affichage de la description DMOZ dans MSN Search
- Optimiser le référencement d'un blog Dotclear : balises TITLE et META
- Liste d'erreurs classiques de duplicate content
- Comment lutter contre les mauvaises redirections 302 (temporaires)
- Le contenu dupliqué : impact et solutions pour le référencement
- Articles de R et D sur le PageRank, le SpamRank et le spam...
- Domaine favori - URL canonique
- Comment savoir si duplicate content
- Duplicate Content : comment savoir ?
- Comment savoir le nombre de page duplicate.
- Comment savoir d'où viennent les content target?
- comment éviter un duplicate content
- comment eviter le duplicate content
- Comment éviter le duplicate content ?
- Comment éviter duplicate content....
- comment eviter le Duplicate Content ?
- Comment annuler un duplicate content? RESOLU
- Duplicate content, comment s'en débarrasser ?
- Duplicate content, comment arreter le massacre
- Duplicate content comment m'en sortir
- Comment éviter duplicate content avec variables
- comment evité un duplicate content (Redirection de pages)
- Analyse de similarité textuelle
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités



le forum