PDf et html duplicate content ?
Règles du forum
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !
Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !
Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).
14 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- Hartas
- WRInaute discret

- Messages: 66
- Inscription: 12 Nov 2006
PDf et html duplicate content ?
Bonjour,
Petite question qui me travail : le fait d'avoir de l'info dans une page en html et de proposer le téléchargement d'un pdf contenant à peu près les mêmes infos peut-il être interprété comme un duplicate content par google ?
Petite question qui me travail : le fait d'avoir de l'info dans une page en html et de proposer le téléchargement d'un pdf contenant à peu près les mêmes infos peut-il être interprété comme un duplicate content par google ?
- Sepino
- WRInaute discret

- Messages: 89
- Inscription: 7 Aoû 2006
YoyoS a écrit:mauvais ça ! Une solution serait peut-être d'interdire l'indexation des pdf par le robot alors... Ceci laisserait donc quand même la possibilité au visiteur de le télécharger sans devoir l'enlever.
Rien n'est prouvé encore !
Quand on ne connait pas le problème, inutile de chercher des solutions.
-

Monty973 - WRInaute passionné

- Messages: 1636
- Inscription: 21 Mar 2006
Szarah a écrit:GG lit les .pdf, il les indexe et il n'est pas idiot au point de considérer leur contenu comme duplicate par rapport à des pages html.
Dit autrement : le duplicate content, c'est entre documents de même type que ça se joue.
Je ne serais pas aussi affirmatif, mais cela semble logique effectivement.
Il est tout à fait légitime d'avoir du contenu sous plusieurs formats, et ce ne serait pas très intelligent de la part de Google de pénaliser cela.
- Hartas
- WRInaute discret

- Messages: 66
- Inscription: 12 Nov 2006
c'est aussi la réflexion que j'avais : format différent => traitements différents. D'un autre coté GG fait-il une analyse aussi poussé avec les PDF qu'avec les pages html?? En allant jusqu'au bout de la réflexion, on pourrait tres bien avoir du duplicate content entre fichier PDF. Qu'en pensez-vous?
-

Serious - WRInaute passionné

- Messages: 2438
- Inscription: 21 Nov 2005
Hartas a écrit:Petite question qui me travail : le fait d'avoir de l'info dans une page en html et de proposer le téléchargement d'un pdf contenant à peu près les mêmes infos peut-il être interprété comme un duplicate content par google ?
Je pense que oui.
Hartas a écrit:D'un autre coté GG fait-il une analyse aussi poussé avec les PDF qu'avec les pages html?
Je pense que oui.
Hartas a écrit:En allant jusqu'au bout de la réflexion, on pourrait tres bien avoir du duplicate content entre fichier PDF. Qu'en pensez-vous?
Je pense que oui.
Mais je ne pense pas qu'il existe de penalite pour le contenu duplique.
-

lg - WRInaute discret

- Messages: 161
- Inscription: 12 Juil 2004
Bonjour !
Question que je me suis posé il y a environ 1 an et apparemment google ne pénalise pas, je n'ai pas doublé l'ensemble du site en pdf mais quand même quelques pages et à ce jour je n'ai pas de problème.
J'ai simplement pris la précaution de ne pas mettre les pdf à la racine mais dans un répertoire.
Paul
Question que je me suis posé il y a environ 1 an et apparemment google ne pénalise pas, je n'ai pas doublé l'ensemble du site en pdf mais quand même quelques pages et à ce jour je n'ai pas de problème.
J'ai simplement pris la précaution de ne pas mettre les pdf à la racine mais dans un répertoire.
Paul
- Sepino
- WRInaute discret

- Messages: 89
- Inscription: 7 Aoû 2006
Serious a écrit:Hartas a écrit:Petite question qui me travail : le fait d'avoir de l'info dans une page en html et de proposer le téléchargement d'un pdf contenant à peu près les mêmes infos peut-il être interprété comme un duplicate content par google ?
Je pense que oui.Hartas a écrit:D'un autre coté GG fait-il une analyse aussi poussé avec les PDF qu'avec les pages html?
Je pense que oui.Hartas a écrit:En allant jusqu'au bout de la réflexion, on pourrait tres bien avoir du duplicate content entre fichier PDF. Qu'en pensez-vous?
Je pense que oui.
Mais je ne pense pas qu'il existe de penalite pour le contenu duplique.
Tu penses trop.
- aljaber
- WRInaute discret

- Messages: 51
- Inscription: 1 Jan 2007
Il nous est peut être tous arriver de tomber sur un site qui présente un documentation sous différents formats. C'est du bon sens que de penser que cela ne peut être considéré comme du duplicate content. Pour affirmer le contraire, faut des preuvres, des preuves irréfutables 
-

Serious - WRInaute passionné

- Messages: 2438
- Inscription: 21 Nov 2005
aljaber a écrit:Il nous est peut être tous arriver de tomber sur un site qui présente un documentation sous différents formats. C'est du bon sens que de penser que cela ne peut être considéré comme du duplicate content. Pour affirmer le contraire, faut des preuvres, des preuves irréfutables
http://www.google.com/search?hl=en&lr=& ... tnG=Search
Google detecte clairement le contenu duplique et cache un des resultats.
PS: page pris au hasard
14 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Duplicate content et pdf
- Duplicate content : pdf ?
- HTML + PDF = duplicate content ?
- Les articles version PDF et le duplicate content
- duplicate content - format PDF et version HTML
- Pages produits + version pdf = duplicate content ?
- Page pdf, page html et duplicate content
- Le Duplicate-Content en question : un cas de duplicate content important non-pénalisé
- Sale duplicate content (pas content du tous !!!!!) !!!
- Duplicate content ou pas duplicate
- Comment indiquer une URL canonique dans l'entête HTTP
- Articles de R et D sur le PageRank, le SpamRank et le spam...
- La traduction d'un contenu peut-elle générer une pénalité de duplicate content ?
- PDF Quick View : l'outil de Google pour voir les PDF
- Les sites Bounce Pad, pénalisés par le filtre anti-duplicate content de Google ?
- Google Webmaster Tools alerte en cas de pb de duplicate content
Consultez la description détaillée des produits ou services de Google suivants : Google PDF Quick View
- Détection de pages dupliquées
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: mjan et 1 invité





