Le Duplicate-Content en question : un cas de duplicate content important non-pénalisé

hibou57 · 13 Juillet 2010

Hillou les gens,

J’ai reçu et reçois encore de temps en temps des visites de ce site, et les première fois, je me suis demandé : « mais comment se fait-il que je reçoive des visites d’un site Russe ? ». j’ai donc suivi les liens référents, pour découvrir qu’il s’agissait de visites en provenance de la copie d’une page de Wikipédia faisant un lien vers mon principal site.

Ce fut le premier contact pour moi avec ce site, mais pas le dernier.

Dans Google, et seulement dans Google, ce site, academic.ru (du moins certains de ces sous-domaines, comme fr.) ressort régulièrement dans les résultats de Google depuis quelques temps (enfin, sur mes requêtes à moi au moins), pour des pages qui sont elles aussi des copies de Wikipédia.

Comment expliquer à la fois ce phénomène et la théorie selon laquelle Google pénaliserait la duplication de contenu (duplicate-content) ?

Les autres phénomènes supposés être la démonstration de l’existence de cette pénalité de Google, n’avaient-ils pas éventuellement d’autres causes possibles ? (corrélation n’est pas nécessairement cause) Ou alors cette « règle » souffrirait-elle d’exceptions flagrantes ?

rudddy · 13 Juillet 2010

on en a déjà parlé hier sur le forum avec voila

hibou57 · 13 Juillet 2010

rudddy a dit:
on en a déjà parlé hier sur le forum avec voila

Tu veux dire le moteur de recherche Voila ?

lecouti · 13 Juillet 2010

J'ai d'autres cas plus simples encore, qui me font penser que le DC chez Google c'est interdit mais pas grave tant qu'on ne se fait pas attraper. En attendant mes deux exemples caracolent en première page.
Mais c'est vrai que c'est à se demander pourquoi parfois GG le détecte et parfois non

Rod la Kox · 13 Juillet 2010

Je ne le dirais jamais assez, le DC et Google, ça me fait bien rire...

cherchez des fonction php et les premiers résultats retournés seront tous des copies du manuel en ligne...

aladdin · 13 Juillet 2010

même expériance vécue, un plagieur a copié des contenus de ma page, avec mes méta tags (j'avais même mis un meta tag <meta generator="VIM (^_^)" /> pour m'amuser il l 'a copié tel quel) ... et sur certaines requêtes il s'est retrouvé mieux positionné que moi et il l'es toujours ...

Les pénalité dont Google parle il y a que lui qui sait comment ca fonctionne vraiment, un peu de transparence serait la bienvenue de sa part ... c'est également le cas de milliers de sites qui enfreignent toutes les TOS de google adsense et qui continuent à faire de l'argent avec ...

rudddy · 13 Juillet 2010

plus d'infos sur https://www.webrankinfo.com/forum/duplicate-entre-wikipedia-encyclopedie-vo ... 30581.html

Argonaute · 13 Juillet 2010

Il existe plusieurs domaines où le dc n'est pas sanctionné, parce que Google ne peut pas faire autrement : cinéma, théâtre, communication d'entreprise, etc... En bref tous les sites reprenant le contenu fourni par les attachés de presse.
L'exemple le plus frappant est le cinéma où quasiment tous les sites (et pas des petits) ont le même contenu de base et ressortent sans problème dans les résultats.

Il y a beaucoup d'annuairistes et d'agrégateurs sur WRI, ce qui explique la tournure dramatique des conversations liées au DC.

anemone-clown · 13 Juillet 2010

Rod la Kox a dit:
Je ne le dirais jamais assez, le DC et Google, ça me fait bien rire...

Surtout quand ça peut rapporter un max de pub adsense lorsque le copieur affiche des pubs et que l'original n'en affiche pas (academic.ru vs. wikipedia).

Concernant academic, ça fait longtemps que j'en avais déjà fait l'écho et il truste de nombreuses premières places sur GG images dans le domaine animalier-botanique.

Firewave · 13 Juillet 2010

De toute façon là depuis May Day ça tourne au grand n'importe quoi. Je vois de ces grands écarts et des sites sans aucun contenu, mais vraiment aucun viennent sur la première page des résultats avec même pas masse de BLs. Tu te dis qu'il y a un souci dans leur algo à google. Le plus drôle de ce que j'ai vu c'était un site sous forme de:
-http://www.mot-clé-mot-clé2.com/clé/mot-clé-mot-clé2.php -
Venir en première page sur une grosse requête sans rien avoir de probant niveau opti site si ce n'est cette url à rallonge avec du kw stuffing et c'est la même chose sur quasiment toutes les requêtes que j'observe actuellement. Tu as le mot clé dans le ndd t'es propulsé...

milkiway · 13 Juillet 2010

Google est pertinent sur le DC. Il le sanctionne (ou plutôt le filtre à mon sens) lorsque la duplication n'est pas logique.
Certains secteurs acceptent de très forts taux de DC.

hibou57 · 13 Juillet 2010

Firewave a dit:
De toute façon là depuis May Day ça tourne au grand n'importe quoi.

Celle là il faut que quelqu’un la mette dans le sujet des citations Best-Of des grandes pensées éclairées

Firewave a dit:
[...] Le plus drôle de ce que j'ai vu c'était un site sous forme de:
-http://www.mot-clé-mot-clé2.com/clé/mot-clé-mot-clé2.php . Venir en première page sur une grosse requête sans rien avoir de probant niveau opti site si ce n'est cette url à rallonge avec du kw stuffing et c'est la même chose sur quasiment toutes les requêtes que j'observe actuellement. Tu as le mot clé dans le ndd t'es propulsé...

Ça c’est un autre sujet, mais sinon oui, on est au moins trois à avoir remarqué. À quand les sites qui se réduisent à une URL ? Merci Google....

Ce n’était pas la peine de mettre fin au bourrage des balises meta qu’on avait en 1995-2000, pour encourager la même chose avec les NdD.

Tu veux ouvrir un topic sur la question ?

milkiway a dit:
Google est pertinent sur le DC. Il le sanctionne (ou plutôt le filtre à mon sens) lorsque la duplication n'est pas logique.
Certains secteurs acceptent de très forts taux de DC.

Wikipédia.... c’est un secteur en particulier ? 8O

zeb · 13 Juillet 2010

hibou57 a dit:
milkiway a dit:

Google est pertinent sur le DC. Il le sanctionne (ou plutôt le filtre à mon sens) lorsque la duplication n'est pas logique.
Certains secteurs acceptent de très forts taux de DC.

Cliquez pour agrandir...

Wikipédia.... c’est un secteur en particulier ? 8O

Celui là et d'autres en effet si tu prend le cas particulier de la presse et si google blacklistait le DC l'AFP irait a la trappe direct sans passer par la cas départ et sans toucher 20 000 (du moins peut être pas l'AFp mais toutes les grandes maisons de presse)

Cinéma idem etc ...

Rod la Kox · 14 Juillet 2010

hibou57 a dit:
Firewave a dit:

De toute façon là depuis May Day ça tourne au grand n'importe quoi.

Cliquez pour agrandir...

Celle là il faut que quelqu’un la mette dans le sujet des citations Best-Of des grandes pensées éclairées

Tiens, je t'en file une autre...
Le SEO ? Depuis le May Day, ça tourne au SOS.

zeb · 14 Juillet 2010

Rod la Kox a dit:
Le SEO ? Depuis le May Day, ça tourne au SOS.

Elle est vraiment excellente celle là Reco pour toi Rod :lol:

hibou57 · 14 Juillet 2010

zeb a dit:
Rod la Kox a dit:

Le SEO ? Depuis le May Day, ça tourne au SOS.

Cliquez pour agrandir...

Elle est vraiment excellente celle là Reco pour toi Rod :lol:

May Day, bloody May Day (pardon pour la parodie, sans vouloir offenser cette chanson qui dit des choses fortes)

May Day, May Day, nous allons nous écraser ! (l’histoire ne dit pas si c’est la voie du pilote du site ou celle du pilote de Google qui parle.... suspens)

IT-Renew · 22 Février 2014

Désolé de déterré un sujet, mais du coup je voulais donner mon opinion, en 2014 =)

Bon déjà GG ayant énormément renforcé la lute du DC, les sites sont plus facilement reperés.

Après, en pratique comment on imagine que ça peut se passer? Tout simplement de la même méthode que lors d'une inscription dans un annuaire (sérieux) demandant justement une description unique (pour éviter ce célèbre DC).

C'est simple, on prend les 3 ou 4 premières lignes et on fais copier coller dans les résultats de recherche : si on voit deux (voir plus des fois tellement certains webmaster sont doués) sites qui ont les mêmes lignes, bas là sanction est immédiate...

Si rien n'est trouvé, je pense qu'ils check les BL, qu'ils vérifient le code source pour voir si une source externe est citée et vérifie cette source si le texte est identique ou fortement similaire...

Bref, il est facile (en tout cas désormais) de détecter le DC.

Après, si on a un site qui fait du DC, mais qui se situe déjà dans la sandbox ou qui est dans les choux (15ème page), GG n'a même pas à faire la sanction, puisque le site n'est déjà pas référencé...

Et comme on dit "pas vu, pas prit", mais perso je ne tenterais pas vu la rapidité des sanctions actuelles...

axelsoc · 7 Mars 2014

Une question qui me taraude :
dans le cas où un autre site fait du plagiat et copie mon contenu, suis-je aussi pénalisé ? Ou bien Google est assez intelligent pour savoir qui a commis la faute ?

zeb · 17 Avril 2014

axelsoc a dit:
Ou bien Google est assez intelligent pour savoir qui a commis la faute ?

non

malheureusement il ne peut le savoir ni personne d’ailleurs. Et c'est le site le plus trusranké qui gagne.