PDf et html duplicate content ?

Règles du forum
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !

Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

Hartas
WRInaute discret
WRInaute discret
 
Messages: 66
Inscription: 12 Nov 2006

PDf et html duplicate content ?

Message le Jeu Jan 11, 2007 15:36

Bonjour,

Petite question qui me travail : le fait d'avoir de l'info dans une page en html et de proposer le téléchargement d'un pdf contenant à peu près les mêmes infos peut-il être interprété comme un duplicate content par google ?


e-kiwi
Modérateur
Modérateur
 
Messages: 15617
Inscription: 23 Déc 2003

Message le Jeu Jan 11, 2007 15:53

en voila une bonne question :) aucune idée


cosmixi
WRInaute impliqué
WRInaute impliqué
 
Messages: 743
Inscription: 1 Sep 2006

Message le Jeu Jan 11, 2007 16:05

Google lis les pdf ... on peu donc facilement imaginer qu'il y ai des risques de duplicated content !


YoyoS
WRInaute accro
WRInaute accro
 
Messages: 3835
Inscription: 14 Sep 2006

Message le Jeu Jan 11, 2007 16:14

mauvais ça ! Une solution serait peut-être d'interdire l'indexation des pdf par le robot alors... Ceci laisserait donc quand même la possibilité au visiteur de le télécharger sans devoir l'enlever.

Sepino
WRInaute discret
WRInaute discret
 
Messages: 89
Inscription: 7 Aoû 2006

Message le Jeu Jan 11, 2007 17:16

YoyoS a écrit:mauvais ça ! Une solution serait peut-être d'interdire l'indexation des pdf par le robot alors... Ceci laisserait donc quand même la possibilité au visiteur de le télécharger sans devoir l'enlever.


Rien n'est prouvé encore !

Quand on ne connait pas le problème, inutile de chercher des solutions.


Szarah
WRInaute accro
WRInaute accro
 
Messages: 8093
Inscription: 22 Fév 2006

Message le Jeu Jan 11, 2007 17:26

GG lit les .pdf, il les indexe et il n'est pas idiot au point de considérer leur contenu comme duplicate par rapport à des pages html.
Dit autrement : le duplicate content, c'est entre documents de même type que ça se joue.


Monty973
WRInaute passionné
WRInaute passionné
 
Messages: 1636
Inscription: 21 Mar 2006

Message le Jeu Jan 11, 2007 17:30

Szarah a écrit:GG lit les .pdf, il les indexe et il n'est pas idiot au point de considérer leur contenu comme duplicate par rapport à des pages html.
Dit autrement : le duplicate content, c'est entre documents de même type que ça se joue.


Je ne serais pas aussi affirmatif, mais cela semble logique effectivement.

Il est tout à fait légitime d'avoir du contenu sous plusieurs formats, et ce ne serait pas très intelligent de la part de Google de pénaliser cela.

Hartas
WRInaute discret
WRInaute discret
 
Messages: 66
Inscription: 12 Nov 2006

Message le Jeu Jan 11, 2007 17:59

c'est aussi la réflexion que j'avais : format différent => traitements différents. D'un autre coté GG fait-il une analyse aussi poussé avec les PDF qu'avec les pages html?? En allant jusqu'au bout de la réflexion, on pourrait tres bien avoir du duplicate content entre fichier PDF. Qu'en pensez-vous?


Serious
WRInaute passionné
WRInaute passionné
 
Messages: 2438
Inscription: 21 Nov 2005

Message le Jeu Jan 11, 2007 18:14

Hartas a écrit:Petite question qui me travail : le fait d'avoir de l'info dans une page en html et de proposer le téléchargement d'un pdf contenant à peu près les mêmes infos peut-il être interprété comme un duplicate content par google ?

Je pense que oui.
Hartas a écrit:D'un autre coté GG fait-il une analyse aussi poussé avec les PDF qu'avec les pages html?

Je pense que oui.
Hartas a écrit:En allant jusqu'au bout de la réflexion, on pourrait tres bien avoir du duplicate content entre fichier PDF. Qu'en pensez-vous?

Je pense que oui.


Mais je ne pense pas qu'il existe de penalite pour le contenu duplique.


lg
WRInaute discret
WRInaute discret
 
Messages: 161
Inscription: 12 Juil 2004

Message le Jeu Jan 11, 2007 18:53

Bonjour !
Question que je me suis posé il y a environ 1 an et apparemment google ne pénalise pas, je n'ai pas doublé l'ensemble du site en pdf mais quand même quelques pages et à ce jour je n'ai pas de problème.
J'ai simplement pris la précaution de ne pas mettre les pdf à la racine mais dans un répertoire.
Paul

Sepino
WRInaute discret
WRInaute discret
 
Messages: 89
Inscription: 7 Aoû 2006

Message le Mar Jan 16, 2007 16:03

Serious a écrit:
Hartas a écrit:Petite question qui me travail : le fait d'avoir de l'info dans une page en html et de proposer le téléchargement d'un pdf contenant à peu près les mêmes infos peut-il être interprété comme un duplicate content par google ?

Je pense que oui.
Hartas a écrit:D'un autre coté GG fait-il une analyse aussi poussé avec les PDF qu'avec les pages html?

Je pense que oui.
Hartas a écrit:En allant jusqu'au bout de la réflexion, on pourrait tres bien avoir du duplicate content entre fichier PDF. Qu'en pensez-vous?

Je pense que oui.


Mais je ne pense pas qu'il existe de penalite pour le contenu duplique.


Tu penses trop.


Serious
WRInaute passionné
WRInaute passionné
 
Messages: 2438
Inscription: 21 Nov 2005

Message le Mar Jan 16, 2007 17:51

Sepino a écrit:Tu penses trop.

Certes. J'y ai pense.

aljaber
WRInaute discret
WRInaute discret
 
Messages: 51
Inscription: 1 Jan 2007

Message le Mer Jan 17, 2007 12:31

Il nous est peut être tous arriver de tomber sur un site qui présente un documentation sous différents formats. C'est du bon sens que de penser que cela ne peut être considéré comme du duplicate content. Pour affirmer le contraire, faut des preuvres, des preuves irréfutables :roll:


Serious
WRInaute passionné
WRInaute passionné
 
Messages: 2438
Inscription: 21 Nov 2005

Message le Mer Jan 17, 2007 13:10

aljaber a écrit:Il nous est peut être tous arriver de tomber sur un site qui présente un documentation sous différents formats. C'est du bon sens que de penser que cela ne peut être considéré comme du duplicate content. Pour affirmer le contraire, faut des preuvres, des preuves irréfutables

http://www.google.com/search?hl=en&lr=& ... tnG=Search
Google detecte clairement le contenu duplique et cache un des resultats.

PS: page pris au hasard


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google PDF Quick View

  • Détection de pages dupliquées
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.


Qui est en ligne

Utilisateurs parcourant ce forum: mjan et 1 invité