Tout savoir sur le filtre Duplicate Content de Google
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

WebRankInfo - Administrateur du site

- Messages: 19422
- Inscription: 19 Avr 2002
Tout savoir sur le filtre Duplicate Content de Google
Le sujet étant de plus en plus au coeur des pb constatés par les WRInautes et tous ceux qui s'intéressent au référencement, j'ai décidé de constituer un dossier entièrement consacré au filtre de Google sur le duplicate content.
Bonne lecture et merci encore aux 5 participants !
J'espère que mon dossier vous plaira et vous sera utile...
Olivier
Bonne lecture et merci encore aux 5 participants !
J'espère que mon dossier vous plaira et vous sera utile...
Olivier
-

thickparasite - WRInaute passionné

- Messages: 1294
- Inscription: 26 Avr 2003
Re: Tout savoir sur le filtre Duplicate Content de Google
Cette analyse va servir de référence.
Les incompréhensions sur le sujet découlent souvent du fait que le paramètre a évolué dans le temps.
Auparavant, c'était largement plus pénalisant puisque c'est maintenant plutôt une "non pondération" à la place d'une pénalité de laquelle il était compliqué de sortir.
Malgré les progrès de Google à propos du Dup, il reste tout de même un point épineux qui concerne la popularité des pages. Il est toujours possible de piquer du contenu et mieux se positionner que la page d'origine si la page "voleuse" est plus populaire.
Les incompréhensions sur le sujet découlent souvent du fait que le paramètre a évolué dans le temps.
Auparavant, c'était largement plus pénalisant puisque c'est maintenant plutôt une "non pondération" à la place d'une pénalité de laquelle il était compliqué de sortir.
Malgré les progrès de Google à propos du Dup, il reste tout de même un point épineux qui concerne la popularité des pages. Il est toujours possible de piquer du contenu et mieux se positionner que la page d'origine si la page "voleuse" est plus populaire.
-

WebRankInfo - Administrateur du site

- Messages: 19422
- Inscription: 19 Avr 2002
Re: Tout savoir sur le filtre Duplicate Content de Google
thickparasite a écrit:Auparavant, c'était largement plus pénalisant puisque c'est maintenant plutôt une "non pondération" à la place d'une pénalité de laquelle il était compliqué de sortir.
je pense qu'il y en a un paquet qui vont témoigner que c'est pas tout à fait ça
disons que le résultat du filtre peut être -90% de trafic Google...
Je précise que j'essaierai de compléter le dossier avec les éléments que j'ai peut-être oubliés.
Enfin, que me conseillez-vous pour éviter qu'on me copie cet article (comme la plupart de mes articles) ? ce serait dommage qu'il génère des contenus dupliqués
-

5_legs - WRInaute passionné

- Messages: 2072
- Inscription: 30 Avr 2006
Re: Tout savoir sur le filtre Duplicate Content de Google
Excellent 'tutoriel' et très bon choix d'y avoir adjoint plusieurs participants.
J'ai trouvé ça très intéressant de pouvoir avoir des visions différentes sur ce thème.
D'ailleurs, les réponses des participants aux questions ne se rejoignent pas souvent :-)
J'ajouterai que le "filtre" peut parfois être appliqué de manière plus faible (de l'ordre de 75% de baisse de trafic organique par exemple)
Pour la demande de ré-examen, je rejoins les avis sur le fait que cela n'est pas adapté à ce cas de figure.
Merci aux participants !
J'ai trouvé ça très intéressant de pouvoir avoir des visions différentes sur ce thème.
D'ailleurs, les réponses des participants aux questions ne se rejoignent pas souvent :-)
J'ajouterai que le "filtre" peut parfois être appliqué de manière plus faible (de l'ordre de 75% de baisse de trafic organique par exemple)
Pour la demande de ré-examen, je rejoins les avis sur le fait que cela n'est pas adapté à ce cas de figure.
Merci aux participants !
-

fandecine - Modérateur

- Messages: 2047
- Inscription: 2 Avr 2005
Re: Tout savoir sur le filtre Duplicate Content de Google
bravo Olivier ! Ca, c'est du dossier !
Le problème du Contenu dupliqué me préoccupe depuis longtemps, d'autant que dans le cas de mes sites, une partie non négligeable des contenus n'est pas ma propriété et se retrouve de ce fait sur tous les sites de cinéma (synopsis, images, vidéos ...)
En ce qui concerne le contenu texte, en particulier le synopsis des films, celui-ci est plus ou moins imposé par le distributeur (synopsis officiel, qui parfois change dans le temps, comme peut changer l'office officielle ou la bande annonce officielle etc ...)
Allez sur un site cinéma, copiez le synopsis d'un film dans la barre de recherche de google et vous serais impressionné par le nombre de résultats.Malgré tout, de nombreuses pages contenant ce synopsis officiel ressortent sur une recherche sur le titre du film (j'ai vérifié certaine requêtes et je trouve jusqu'à 90% des 50 premiers résultats avec ce même synopsis)
Il ne semble donc pas que ces pages soient "filtrés/pénalisées".Peut-être tout simplement parce que le synopsis ne représente qu'une faible partie du contenu texte des pages, peut-être aussi parce que google n'applique pas la même échelle de "pénalisation" selon les thématiques.
Un exemple pour illustrer cette dernière hypothèse concerne les manuels des commandes linux. Tapez "man ls" par exemple dans google et vous verrez que la majorité des résultats sont des pages reprenant à l'identique et mot pour mot le résultat de la commande "man ls" de linux.
J'aimerais bien avoir vos avis la dessus
Le problème du Contenu dupliqué me préoccupe depuis longtemps, d'autant que dans le cas de mes sites, une partie non négligeable des contenus n'est pas ma propriété et se retrouve de ce fait sur tous les sites de cinéma (synopsis, images, vidéos ...)
En ce qui concerne le contenu texte, en particulier le synopsis des films, celui-ci est plus ou moins imposé par le distributeur (synopsis officiel, qui parfois change dans le temps, comme peut changer l'office officielle ou la bande annonce officielle etc ...)
Allez sur un site cinéma, copiez le synopsis d'un film dans la barre de recherche de google et vous serais impressionné par le nombre de résultats.Malgré tout, de nombreuses pages contenant ce synopsis officiel ressortent sur une recherche sur le titre du film (j'ai vérifié certaine requêtes et je trouve jusqu'à 90% des 50 premiers résultats avec ce même synopsis)
Il ne semble donc pas que ces pages soient "filtrés/pénalisées".Peut-être tout simplement parce que le synopsis ne représente qu'une faible partie du contenu texte des pages, peut-être aussi parce que google n'applique pas la même échelle de "pénalisation" selon les thématiques.
Un exemple pour illustrer cette dernière hypothèse concerne les manuels des commandes linux. Tapez "man ls" par exemple dans google et vous verrez que la majorité des résultats sont des pages reprenant à l'identique et mot pour mot le résultat de la commande "man ls" de linux.
J'aimerais bien avoir vos avis la dessus
-

thickparasite - WRInaute passionné

- Messages: 1294
- Inscription: 26 Avr 2003
Re: Tout savoir sur le filtre Duplicate Content de Google
WebRankInfo a écrit:je pense qu'il y en a un paquet qui vont témoigner que c'est pas tout à fait ça :!:
disons que le résultat du filtre peut être -90% de trafic Google...
C'est exact car il faut aussi parler du facteur temps. En l'occurrence, on peut même débattre sur l'éternité que Google met parfois à trier le Dup. Je pense notamment à l'application du rel="canonical" qui peut vraiment prendre longtemps... très longtemps avant de faire effet.
Bien souvent, les sites qui sont soi-disant pénalisés pour cause de Dup n'ont pas laissé le temps agir.
Évidemment, je ne parle pas des scrapers et autres tentatives de spam qui sont bel et bien pénalisés. Pour le commun des sites qui va avoir son contenu repris sous différentes URLs internes ou même ses articles repris ailleurs, je persiste dans la "non pondération" plutôt que pénalité à proprement parler.
Il y a aussi un autre sujet qui mérite d'être débattu. Cela concerne les recommandations de Google qui suggère de laisser crawler le Dup interne avant d'agir si jamais il ne s'en sort pas. Ils disent à la limite de mettre rel="canonical", mais pas de meta noindex ou blocage via robots.txt.
Pour ma part, je préfère largement prendre des précautions en amont.
Ah oui, un truc que je ne pense pas avoir lu dans l'article (ou alors j'ai pas vu/lu) concerne le fameux lien vers la source d'origine. C'est quand même le moyen le plus clean d'éviter un souci quand on reprend un texte déjà présent sur la Toile.
- L.Jee
- WRInaute accro

- Messages: 7192
- Inscription: 11 Déc 2007
Re: Tout savoir sur le filtre Duplicate Content de Google
fandecine a écrit:Allez sur un site cinéma, copiez le synopsis d'un film dans la barre de recherche de google et vous serais impressionné par le nombre de résultats.Malgré tout, de nombreuses pages contenant ce synopsis officiel ressortent sur une recherche sur le titre du film (j'ai vérifié certaine requêtes et je trouve jusqu'à 90% des 50 premiers résultats avec ce même synopsis)
Cela rejoint ce que j'avais déjà dit, mais pas précisé à Olivier pour son dossier. Au dela d'un certain nombre de copies, Google ne pénalise plus via ce contenu car celui-ci est considéré, disons, comme citation et peut donc être pertinent. Testez par exemple les conditions d'utilisations pour Adsense que Google nous a fait rajouter sur nos sites. Vous verrez que le résultat est très surprenant, on trouve des centaines de pages dans la SERP avant le fameux encart de filtrage.
Il ne semble donc pas que ces pages soient "filtrés/pénalisées".Peut-être tout simplement parce que le synopsis ne représente qu'une faible partie du contenu texte des pages, peut-être aussi parce que google n'applique pas la même échelle de "pénalisation" selon les thématiques.
Il est vrai aussi et Google l'avait déjà dit que le contenu dupliqué même en totalité sur une page, mais venant de différentes sources peut-être pertinent. C'est une source d'info différente des autres, cependant, c'est encore très aléatoire cette partie et la gestion de celle-ci par la filtre. Nul doute que ça ira en s'améliorant.
- L.Jee
- WRInaute accro

- Messages: 7192
- Inscription: 11 Déc 2007
Re: Tout savoir sur le filtre Duplicate Content de Google
thickparasite a écrit:Ah oui, un truc que je ne pense pas avoir lu dans l'article (ou alors j'ai pas vu/lu) concerne le fameux lien vers la source d'origine. C'est quand même le moyen le plus clean d'éviter un souci quand on reprend un texte déjà présent sur la Toile.
Ca rejoins une partie de ce que je disais sur le dossier. J'ai déjà eu le cas d'un site reprenant l'intro de mon article avec lien vers mon article et pour autant, c'est lui qui sortait sur les phrases dupliquées, mais aussi sur la requête visée. Bon ça commence à dater comme expérience, le filtre est peut-être réglé sur ce point depuis.
Qui test sur un site jeune de mettre son intro + lien sur Scoopeo par exemple pour voir qui ressortira sur Google ?
-

thickparasite - WRInaute passionné

- Messages: 1294
- Inscription: 26 Avr 2003
Re: Tout savoir sur le filtre Duplicate Content de Google
Comme je dis dans mon premier message, il est toujours possible de se positionner devant la source d'origine.
-

sr - WRInaute passionné

- Messages: 1237
- Inscription: 15 Mai 2003
Re: Tout savoir sur le filtre Duplicate Content de Google
Bonjour à tous et merci à Olivier de m'avoir fait participer.
Bravo pour ce dossier pour le moins consistant. A part les longues diatribes d'Ybet, j'avais rarement vu aussi conséquent ;-)
Ce dossier est d'autant plus utile que, comme le fait remarquer 5 legs, les avis des uns et des autres divergent parfois. Sans doute parce que les cas vécus sont différents, mais aussi parce que Google a sans doute fait évoluer les choses au fil du temps. Nos retours ne sont que des expériences personnelles.
En résumé, je rejoins toutefois L.Jee et Laurent, il est toujours possible pour un site ayant une certaine autorité de se positionner avant la source d'origine.
Bravo pour ce dossier pour le moins consistant. A part les longues diatribes d'Ybet, j'avais rarement vu aussi conséquent ;-)
Ce dossier est d'autant plus utile que, comme le fait remarquer 5 legs, les avis des uns et des autres divergent parfois. Sans doute parce que les cas vécus sont différents, mais aussi parce que Google a sans doute fait évoluer les choses au fil du temps. Nos retours ne sont que des expériences personnelles.
En résumé, je rejoins toutefois L.Jee et Laurent, il est toujours possible pour un site ayant une certaine autorité de se positionner avant la source d'origine.
-

djmael - WRInaute occasionnel

- Messages: 336
- Inscription: 2 Juil 2008
Re: Tout savoir sur le filtre Duplicate Content de Google
excellent article olivier,
très détailler, je partage l'avis de sr..
le duplicate content à beaucoup évoluer au cours du temps donc nos expériences sont divers et les avis des conséquences d'une détection DC n'est pas la même..
merci ;)
très détailler, je partage l'avis de sr..
le duplicate content à beaucoup évoluer au cours du temps donc nos expériences sont divers et les avis des conséquences d'une détection DC n'est pas la même..
merci ;)
-

Yves rogne - Nouveau WRInaute

- Messages: 48
- Inscription: 16 Fév 2010
Re: Tout savoir sur le filtre Duplicate Content de Google
Merci pour cet article bien documenté qui éclaire un peu les newbies comme moi .
-

carole heinz - WRInaute accro

- Messages: 2855
- Inscription: 28 Fév 2007
Re: Tout savoir sur le filtre Duplicate Content de Google
tiens! ça me rappelle qu'en 2008, lorsque j'avais pointé cette problématique,
il y avait eu pas mal de ricanements (plus ou moins grinçants) ici et là:
- Google tue le mythe des pénalités pour duplicate content
- SEO + parano = pipo
- les futures pénalités de Google révélées
- mythe contenu dupliqué sur Google
heureusement certains avaient été moins prompts au démolissage.
Google serait donc dorénavant en mesure de détecter le duplicate content sur de petites parties de pages voire des petites parties de phrases (plutôt que d’effectuer l’analyse sur le contenu global d’une page). Il n’est donc plus possible de créer des pages “patchwork” reprenant un peu de contenu par ici, un peu de contenu par là et mélangeant le tout.
il y avait eu pas mal de ricanements (plus ou moins grinçants) ici et là:
- Google tue le mythe des pénalités pour duplicate content
- SEO + parano = pipo
- les futures pénalités de Google révélées
- mythe contenu dupliqué sur Google
heureusement certains avaient été moins prompts au démolissage.
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Duplicate content, tout le site exclu de google?
- Recherche et Filtre = Duplicate Content ?
- Comparateur de prix et filtre Duplicate Content
- Comment savoir si duplicate content
- Duplicate Content : comment savoir ?
- [duplicate content] Savoir si un texte existe déjà
- Comment savoir les page en duplicate content ?
- URL Canoniques mais duplicate content tout de même.
- Le Duplicate-Content en question : un cas de duplicate content important non-pénalisé
- [Google] Tout ce que vous vouliez savoir
- La traduction d'un contenu peut-elle générer une pénalité de duplicate content ?
- Les sites Bounce Pad, pénalisés par le filtre anti-duplicate content de Google ?
- Google Webmaster Tools alerte en cas de pb de duplicate content
- Nouveau Panda en France (dimanche 15 janvier 2012)
- Les infos fournies par Google au SEO Campus Paris 2012
- Similarité et duplicate content
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
