Google et le duplicate
24 messages
• Page 1 sur 2 • 1, 2
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- L.Jee
- WRInaute accro

- Messages: 7191
- Inscription: 11 Déc 2007
Google et le duplicate
Bonsoir à tous,
J'écris hier un petit article, indexé dans les 5 minutes et qui est en moins de 24h repris par un site genevois. Au final, Google ne ressort pas ma page, seul ma home ressort dans les résultats et le pire c'est que Google fait très bien ressortir cet enfoiré qui m'a tout simplement pompé ...
Exemple: http://www.google.fr/search?num=100&hl= ... cher&meta=
C'est pas nouveau pour bon nombre de gens, mais beaucoup était réticent quand on en parlait, voici une preuve. Page indexé avec 24h de différence mais ça ne change rien la plus récente seulement est conservée pour les serp.
Quand on regarde, il a juste pompé le début et a fait un lien vers la source, mais le résultat c'est mon article entier qui disparait de Google comme on le constate sur cette phrase qui est uniquement présente normalement sur l'article: http://www.google.fr/search?num=100&hl= ... cher&meta=
Edit: Reprise du site genevois supprimée. Reste à voir comment Google réagit.
J'écris hier un petit article, indexé dans les 5 minutes et qui est en moins de 24h repris par un site genevois. Au final, Google ne ressort pas ma page, seul ma home ressort dans les résultats et le pire c'est que Google fait très bien ressortir cet enfoiré qui m'a tout simplement pompé ...
Exemple: http://www.google.fr/search?num=100&hl= ... cher&meta=
C'est pas nouveau pour bon nombre de gens, mais beaucoup était réticent quand on en parlait, voici une preuve. Page indexé avec 24h de différence mais ça ne change rien la plus récente seulement est conservée pour les serp.
Quand on regarde, il a juste pompé le début et a fait un lien vers la source, mais le résultat c'est mon article entier qui disparait de Google comme on le constate sur cette phrase qui est uniquement présente normalement sur l'article: http://www.google.fr/search?num=100&hl= ... cher&meta=
Edit: Reprise du site genevois supprimée. Reste à voir comment Google réagit.
Dernière édition par L.Jee le Jeu Oct 23, 2008 20:53, édité 1 fois.
- L.Jee
- WRInaute accro

- Messages: 7191
- Inscription: 11 Déc 2007
Oui c'est bien ce que je dis, cette requête ne renvoie rien, la suite de mon article qui lui n'est pas dupliqué (seule l'intro à été reprise) à tout simplement été ignoré par google ... Ybet en avait parlé discrètement dans ses tests, la maintenant ça parait clair ...
On voit que wikio reprend aussi mon intro, cependant lui ne m'a jamais pénalisé pour la suite des articles.
On voit que wikio reprend aussi mon intro, cependant lui ne m'a jamais pénalisé pour la suite des articles.
- xibo
- WRInaute discret

- Messages: 51
- Inscription: 21 Oct 2008
Clair que ça fait peur ! Ybet l'a bien testé aussi c'est vrai.
C'est vraiment flippant, sous prétexte de ne pas faire ressortir de DC, gg se balance complètement de qui est l'auteur. Enfin en tout cas ne met pas suffisamment de moyens en place pour régler ce problème.
Chose qu'ils auraient quand même pu tester convenablement avant de mettre à jour certaines parties de leur algo. Quand on est dans l'incapacité de faire face a un problème on met de côté le DC et dans le doute on affiche tous les résultats !
Merci L.Jee pour ce retour d'expérience.
C'est vraiment flippant, sous prétexte de ne pas faire ressortir de DC, gg se balance complètement de qui est l'auteur. Enfin en tout cas ne met pas suffisamment de moyens en place pour régler ce problème.
Chose qu'ils auraient quand même pu tester convenablement avant de mettre à jour certaines parties de leur algo. Quand on est dans l'incapacité de faire face a un problème on met de côté le DC et dans le doute on affiche tous les résultats !
Merci L.Jee pour ce retour d'expérience.
-

carole heinz - WRInaute accro

- Messages: 2814
- Inscription: 28 Fév 2007
@ L Jee > attention, cela ne fait que 24h. j'ai l'impression que sur des infos très fraîches, Google donne pendant quelques jours l'avantage aux gros sites d'actualités, souvent mis à jour.
il faut aussi lui laisser le temps de faire son travail: indexation immédiate ne rime pas avec analyse immédiate: c'est techniquement impossible de comparer en quelques secondes une page web à des milliards d'autres. donc Google indexe, laisse le bénéfice du doute aux gros, puis analyse et généralement les choses rentrent dans l'ordre. et je ne parle même pas du temps de propagation entre DC, une fois l'analyse effectuée.
je parie que d'ici quelques jours ton site repasse devant.
il faut aussi lui laisser le temps de faire son travail: indexation immédiate ne rime pas avec analyse immédiate: c'est techniquement impossible de comparer en quelques secondes une page web à des milliards d'autres. donc Google indexe, laisse le bénéfice du doute aux gros, puis analyse et généralement les choses rentrent dans l'ordre. et je ne parle même pas du temps de propagation entre DC, une fois l'analyse effectuée.
je parie que d'ici quelques jours ton site repasse devant.
- L.Jee
- WRInaute accro

- Messages: 7191
- Inscription: 11 Déc 2007
Il va repasser car j'ai fais supprimer l'article sur le site en question. Après que mon article repasse devant ok peut-être serait-il repassé devant de toute façon, mais moi je perds la moitié de mon article qu'il ne prend plus en compte. C'est illogique.
Un contenu mis en ligne en premier avec un texte de 300 caractères et indexé le premier se fait aligner par une texte issu de lui n'ayant que 150 caractères et indexé 24h plus tard.
Efficace la pertinence ...
Une news qui apparait 4 jours après l'annonce c'est vraiment extra
(c'était hier et aujourd'hui que c'était intéressant comme info ...)
Un contenu mis en ligne en premier avec un texte de 300 caractères et indexé le premier se fait aligner par une texte issu de lui n'ayant que 150 caractères et indexé 24h plus tard.
Efficace la pertinence ...
carole heinz a écrit:je parie que d'ici quelques jours ton site repasse devant.
Une news qui apparait 4 jours après l'annonce c'est vraiment extra
-

carole heinz - WRInaute accro

- Messages: 2814
- Inscription: 28 Fév 2007
c'est juste la rançon d'une indexation toujours plus rapide. google a mis un coup d'accélérateur sur l'indexation, mais le traitement et l'analyse de la nouvelle page se fait (pour le moment) beaucoup moins rapidement, en tout cas c'est mon sentiment.
c'est dommage d'avoir fait supprimer la page sur le site en question.
c'est dommage d'avoir fait supprimer la page sur le site en question.
- Willgoto
- WRInaute impliqué

- Messages: 702
- Inscription: 19 Oct 2004
La question de duplicate content est quand même parfois embarassante.
Hier, je visitais un site officiel qui affichait des longues informations (datant déjà de quelques mois), qui peuvent être reprises et diffusées par d'autres.
M'interrogeant sur l'opportunité de les reprendre, je regarde où google les trouve déjà: il les trouve sur un site privé qui les a repris intégralement, mais pas sur le site de l'organisme officiel qui en est l'auteur , pourtant normalement référencé.
Hier, je visitais un site officiel qui affichait des longues informations (datant déjà de quelques mois), qui peuvent être reprises et diffusées par d'autres.
M'interrogeant sur l'opportunité de les reprendre, je regarde où google les trouve déjà: il les trouve sur un site privé qui les a repris intégralement, mais pas sur le site de l'organisme officiel qui en est l'auteur , pourtant normalement référencé.
-

UsagiYojimbo - WRInaute accro

- Messages: 8303
- Inscription: 23 Nov 2005
Perso j'ai résolu (enfin en partie) le souci du duplicate content lié à la reprises de flux RSS en proposant dans mon flux un contenu différent (le chapo affiché sur la page d'accueil du site en fait) du contenu principal. Il s'agit de courts paragraphes introductifs destinés à inciter à la lecture de l'article, qui lui est absent du flux.
Certes cela va un peu à l'encontre d'une certaine utilisation du RSS (la possibilité d'obtenir le contenu d'un site sans pour autant devoir surfer sur celui-ci), mais au moins ça me prémunis de ce genre de soucis.
Certes cela va un peu à l'encontre d'une certaine utilisation du RSS (la possibilité d'obtenir le contenu d'un site sans pour autant devoir surfer sur celui-ci), mais au moins ça me prémunis de ce genre de soucis.
-

serval2a - WRInaute accro

- Messages: 3457
- Inscription: 21 Mar 2005
Ben non ce n'est pas la faute de wikio, ni de l'autre site d'ailleurs, c'est Google qui oublie qu'il avait lu ta page en premier et, comme d'hab, qui favorise un peu le gros sites mis à jour fréquemment et qui a beaucoup de liens externes.
@+
PS : si ça t'intéresses, j'avais fait un petit billet sur le problèmle des flux et des moteurs (donc surtout Google) en juillet avec en prime les conseils de Vanessa Fox.
=> http://outils.enaty.com/articles/?2008/ ... te-content
@+
@+
PS : si ça t'intéresses, j'avais fait un petit billet sur le problèmle des flux et des moteurs (donc surtout Google) en juillet avec en prime les conseils de Vanessa Fox.
=> http://outils.enaty.com/articles/?2008/ ... te-content
@+
-

Cendrillon - WRInaute accro

- Messages: 4940
- Inscription: 17 Aoû 2004
C'est vraiment dommage que Google ait du mal avec la notion de citation qui est quand même un des éléments essentiels de la philosophie du WEB. Or, qu'est-ce qu'un flux RSS, si ce n'est une source d'information mise à dispo par un site (créateur du contenu original) vers tous les sites qui le souhaitent et qui font en quelque sorte une citation de ce contenu ... Dès lors, il serait normal que TOUTES les infos issues d'un flux RSS soit systématiquement ignorées par Google sur les sites abonnés.
J'ai d'ailleurs cru voir une balise "quote" dans la dernière édition de HTML 5 ... A part les sites qui utilisent ces sources d'information comme contenu exclusif, je ne pense pas que les utilisateurs de bonne foi de ces flux rechignent à renseigner cette balise. En attendant, pourquoi ne pas afficher ces flux en javascript ?
J'ai d'ailleurs cru voir une balise "quote" dans la dernière édition de HTML 5 ... A part les sites qui utilisent ces sources d'information comme contenu exclusif, je ne pense pas que les utilisateurs de bonne foi de ces flux rechignent à renseigner cette balise. En attendant, pourquoi ne pas afficher ces flux en javascript ?
24 messages
• Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Google + duplicate content
- Google: flux RSS=duplicate content?
- Quand Google fait du Duplicate Content....
- Backlink, Duplicate Content et google se trompe
- google fait du duplicate content
- Cacher à Google du Duplicate Content
- Mauvaise manipulation: sanction de Google duplicate content
- Duplicate content, tout le site exclu de google?
- Finalement Google adore le duplicate mais chez lui
- Démystification des pénalités Google pour duplicate content
- Blog officiel de Google : le point sur le duplicate content
- meme logos et bannieres sur 100 pages duplicate pour google
- Comment supprimer des pages duplicate content sur google?
- indexation google "duplicate content"
- Détection de pages similaires
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités


