Messages: 1323

Enregistré le: 1 Nov 2006

Message le Mar Juil 13, 2010 13:07

Hillou les gens,

J’ai reçu et reçois encore de temps en temps des visites de ce site, et les première fois, je me suis demandé : « mais comment se fait-il que je reçoive des visites d’un site Russe ? ». j’ai donc suivi les liens référents, pour découvrir qu’il s’agissait de visites en provenance de la copie d’une page de Wikipédia faisant un lien vers mon principal site.

Ce fut le premier contact pour moi avec ce site, mais pas le dernier.

Dans Google, et seulement dans Google, ce site, academic.ru (du moins certains de ces sous-domaines, comme fr.) ressort régulièrement dans les résultats de Google depuis quelques temps (enfin, sur mes requêtes à moi au moins), pour des pages qui sont elles aussi des copies de Wikipédia.

Comment expliquer à la fois ce phénomène et la théorie selon laquelle Google pénaliserait la duplication de contenu (duplicate-content) ?

Les autres phénomènes supposés être la démonstration de l’existence de cette pénalité de Google, n’avaient-ils pas éventuellement d’autres causes possibles ? (corrélation n’est pas nécessairement cause) Ou alors cette « règle » souffrirait-elle d’exceptions flagrantes ?
Haut
18 Réponses
Messages: 2570

Enregistré le: 1 Aoû 2007

Message le Mar Juil 13, 2010 13:48

on en a déjà parlé hier sur le forum avec voila
Haut
Messages: 1323

Enregistré le: 1 Nov 2006

Message le Mar Juil 13, 2010 13:54

rudddy a écrit:on en a déjà parlé hier sur le forum avec voila

Tu veux dire le moteur de recherche Voila ?
Haut
Messages: 1556

Enregistré le: 3 Jan 2009

Message le Mar Juil 13, 2010 13:58

J'ai d'autres cas plus simples encore, qui me font penser que le DC chez Google c'est interdit mais pas grave tant qu'on ne se fait pas attraper. En attendant mes deux exemples caracolent en première page.
Mais c'est vrai que c'est à se demander pourquoi parfois GG le détecte et parfois non
Haut
Messages: 3249

Enregistré le: 24 Juin 2008

Message le Mar Juil 13, 2010 14:20

Je ne le dirais jamais assez, le DC et Google, ça me fait bien rire...

cherchez des fonction php et les premiers résultats retournés seront tous des copies du manuel en ligne...
Haut
Messages: 1457

Enregistré le: 29 Avr 2005

Message le Mar Juil 13, 2010 14:22

même expériance vécue, un plagieur a copié des contenus de ma page, avec mes méta tags (j'avais même mis un meta tag <meta generator="VIM (^_^)" /> pour m'amuser il l 'a copié tel quel) ... et sur certaines requêtes il s'est retrouvé mieux positionné que moi et il l'es toujours ...

Les pénalité dont Google parle il y a que lui qui sait comment ca fonctionne vraiment, un peu de transparence serait la bienvenue de sa part ... c'est également le cas de milliers de sites qui enfreignent toutes les TOS de google adsense et qui continuent à faire de l'argent avec ...
Haut
Messages: 2570

Enregistré le: 1 Aoû 2007

Message le Mar Juil 13, 2010 14:23

plus d'infos sur http://forum.webrankinfo.com/duplicate-entre-wikipedia-encyclopedie-vo ... 30581.html
Haut
Messages: 601

Enregistré le: 31 Juil 2008

Message le Mar Juil 13, 2010 14:27

Il existe plusieurs domaines où le dc n'est pas sanctionné, parce que Google ne peut pas faire autrement : cinéma, théâtre, communication d'entreprise, etc... En bref tous les sites reprenant le contenu fourni par les attachés de presse.
L'exemple le plus frappant est le cinéma où quasiment tous les sites (et pas des petits) ont le même contenu de base et ressortent sans problème dans les résultats.

Il y a beaucoup d'annuairistes et d'agrégateurs sur WRI, ce qui explique la tournure dramatique des conversations liées au DC.
Haut
Messages: 1701

Enregistré le: 11 Nov 2007

Message le Mar Juil 13, 2010 16:44

Rod la Kox a écrit:Je ne le dirais jamais assez, le DC et Google, ça me fait bien rire...

Surtout quand ça peut rapporter un max de pub adsense lorsque le copieur affiche des pubs et que l'original n'en affiche pas (academic.ru vs. wikipedia).

Concernant academic, ça fait longtemps que j'en avais déjà fait l'écho et il truste de nombreuses premières places sur GG images dans le domaine animalier-botanique.
Haut
Messages: 2295

Enregistré le: 26 Juil 2009

Message le Mar Juil 13, 2010 16:48

De toute façon là depuis May Day ça tourne au grand n'importe quoi. Je vois de ces grands écarts et des sites sans aucun contenu, mais vraiment aucun viennent sur la première page des résultats avec même pas masse de BLs. Tu te dis qu'il y a un souci dans leur algo à google. Le plus drôle de ce que j'ai vu c'était un site sous forme de:
-http://www.mot-clé-mot-clé2.com/clé/mot-clé-mot-clé2.php -
Venir en première page sur une grosse requête sans rien avoir de probant niveau opti site si ce n'est cette url à rallonge avec du kw stuffing et c'est la même chose sur quasiment toutes les requêtes que j'observe actuellement. Tu as le mot clé dans le ndd t'es propulsé...
Haut
Messages: 4994

Enregistré le: 3 Fév 2004

Message le Mar Juil 13, 2010 18:49

Google est pertinent sur le DC. Il le sanctionne (ou plutôt le filtre à mon sens) lorsque la duplication n'est pas logique.
Certains secteurs acceptent de très forts taux de DC.
Haut
Messages: 1323

Enregistré le: 1 Nov 2006

Message le Mar Juil 13, 2010 22:19

Firewave a écrit:De toute façon là depuis May Day ça tourne au grand n'importe quoi.

Celle là il faut que quelqu’un la mette dans le sujet des citations Best-Of des grandes pensées éclairées

Firewave a écrit:[...] Le plus drôle de ce que j'ai vu c'était un site sous forme de:
-http://www.mot-clé-mot-clé2.com/clé/mot-clé-mot-clé2.php . Venir en première page sur une grosse requête sans rien avoir de probant niveau opti site si ce n'est cette url à rallonge avec du kw stuffing et c'est la même chose sur quasiment toutes les requêtes que j'observe actuellement. Tu as le mot clé dans le ndd t'es propulsé...

Ça c’est un autre sujet, mais sinon oui, on est au moins trois à avoir remarqué. À quand les sites qui se réduisent à une URL ? Merci Google....

Ce n’était pas la peine de mettre fin au bourrage des balises meta qu’on avait en 1995-2000, pour encourager la même chose avec les NdD.

Tu veux ouvrir un topic sur la question ?

milkiway a écrit:Google est pertinent sur le DC. Il le sanctionne (ou plutôt le filtre à mon sens) lorsque la duplication n'est pas logique.
Certains secteurs acceptent de très forts taux de DC.

Wikipédia.... c’est un secteur en particulier ? 8O
Haut
Messages: 13572

Enregistré le: 5 Déc 2004

Message le Mar Juil 13, 2010 22:28

hibou57 a écrit:
milkiway a écrit:Google est pertinent sur le DC. Il le sanctionne (ou plutôt le filtre à mon sens) lorsque la duplication n'est pas logique.
Certains secteurs acceptent de très forts taux de DC.

Wikipédia.... c’est un secteur en particulier ? 8O


Celui là et d'autres en effet si tu prend le cas particulier de la presse et si google blacklistait le DC l'AFP irait a la trappe direct sans passer par la cas départ et sans toucher 20 000 (du moins peut être pas l'AFp mais toutes les grandes maisons de presse)

Cinéma idem etc ...
Haut
Messages: 3249

Enregistré le: 24 Juin 2008

Message le Mer Juil 14, 2010 7:48

hibou57 a écrit:
Firewave a écrit:De toute façon là depuis May Day ça tourne au grand n'importe quoi.

Celle là il faut que quelqu’un la mette dans le sujet des citations Best-Of des grandes pensées éclairées

Tiens, je t'en file une autre...
Le SEO ? Depuis le May Day, ça tourne au SOS.
Haut
Messages: 13572

Enregistré le: 5 Déc 2004

Message le Mer Juil 14, 2010 16:52

Rod la Kox a écrit:Le SEO ? Depuis le May Day, ça tourne au SOS.

Elle est vraiment excellente celle là Reco pour toi Rod :lol:
Haut
Messages: 1323

Enregistré le: 1 Nov 2006

Message le Mer Juil 14, 2010 17:13

zeb a écrit:
Rod la Kox a écrit:Le SEO ? Depuis le May Day, ça tourne au SOS.

Elle est vraiment excellente celle là Reco pour toi Rod :lol:

May Day, bloody May Day (pardon pour la parodie, sans vouloir offenser cette chanson qui dit des choses fortes)


May Day, May Day, nous allons nous écraser ! (l’histoire ne dit pas si c’est la voie du pilote du site ou celle du pilote de Google qui parle.... suspens)
Haut
Messages: 88

Enregistré le: 20 Déc 2012

Message le Sam Fév 22, 2014 17:20

Désolé de déterré un sujet, mais du coup je voulais donner mon opinion, en 2014 =)

Bon déjà GG ayant énormément renforcé la lute du DC, les sites sont plus facilement reperés.

Après, en pratique comment on imagine que ça peut se passer? Tout simplement de la même méthode que lors d'une inscription dans un annuaire (sérieux) demandant justement une description unique (pour éviter ce célèbre DC).

C'est simple, on prend les 3 ou 4 premières lignes et on fais copier coller dans les résultats de recherche : si on voit deux (voir plus des fois tellement certains webmaster sont doués) sites qui ont les mêmes lignes, bas là sanction est immédiate...

Si rien n'est trouvé, je pense qu'ils check les BL, qu'ils vérifient le code source pour voir si une source externe est citée et vérifie cette source si le texte est identique ou fortement similaire...

Bref, il est facile (en tout cas désormais) de détecter le DC.

Après, si on a un site qui fait du DC, mais qui se situe déjà dans la sandbox ou qui est dans les choux (15ème page), GG n'a même pas à faire la sanction, puisque le site n'est déjà pas référencé...

Et comme on dit "pas vu, pas prit", mais perso je ne tenterais pas vu la rapidité des sanctions actuelles...
Haut
Messages: 1

Enregistré le: 7 Mar 2014

Message le Ven Mar 07, 2014 16:55

Une question qui me taraude :
dans le cas où un autre site fait du plagiat et copie mon contenu, suis-je aussi pénalisé ? Ou bien Google est assez intelligent pour savoir qui a commis la faute ?
Haut
Messages: 13572

Enregistré le: 5 Déc 2004

Message le Jeu Avr 17, 2014 15:31

axelsoc a écrit:Ou bien Google est assez intelligent pour savoir qui a commis la faute ?

non :D malheureusement il ne peut le savoir ni personne d’ailleurs. Et c'est le site le plus trusranké qui gagne.
Haut