Valorisation de textes issus d'un livre papier en tant que textes web. Bon plan ?

Nouveau WRInaute
Bonjour à tous,

je suis tout nouveau sur le forum et profite donc de ce premier post pour saluer et remercier l'ensemble de la communauté WRI. Cela fait plusieurs mois que je m'intéresse au référencement et que je consulte assidument le forum. J'ai donc décidé de sauter le pas pour vous rejoindre et apporter si possible ma pierre à l'édifice.

Je me pose une question depuis quelques jours. J'ai lu pas mal de chose au sujet du duplicate content et des filtres pénalisant de Google et autres SERPs. Très clairement whitehat, je me refuse à "pomper" le moindre contenu par ailleurs. Mais voila, la question me turlupine...

Disons que j'ai un excellent bouquin dont il n'existe, A PRIORI, pas de version web. Si je valorise des passages entiers en tant que texte sur mes pages ou dans mes news (en citant la source bien entendu), est-ce que je fais du duplicate content ? C'est une forme de plagiat (je vous l'accorde) mais j'aimerais trouver une réponse "technique" à cette interrogation...

Vous avez un avis ?
 
Nouveau WRInaute
Merci UsagiYojimbo.

"C'est du vol" à a relativiser. Personnellement, j'envisage de citer les sources, de demander une autorisation de l'auteur, voire même de placer un lien Amazon ou équivalent pour que mes visiteurs puissent également acheter le livre en question.

Néanmoins, je vois une vraie possibilité de disposer de contenus qualifiés en exploitant des textes issus de magazine spécialisés.

Lorsqu'il existe une version web d'un magazine papier, seul les abonnés ont accès aux contenus sur le web via login et mot de passe. Ce type de contenu est-il dans les bases de données de google pour autant ?

La question que je me pose ensuite c'est comment vérifier efficacement qu'un texte est dans les bases de données de google ? Au dela d'une simple recherche dans google, existe-t-il un soft ou une méthode pour s'en assurer ?
 
WRInaute accro
Si un magazine dispose d'une version payante dont tous les contenus ne sont pas disponibles, je ne suis pas sûr qu'ils vont apprécier de se les faire repiquer de cette manière. Je ne vois rien à relativiser là-dedans : quand on se permet de piller le contenu de tiers, c'est du vol.

Pour répondre à votre question, les contenus payants sont parfois indexés, même si verrouillés par des accès restreints. C'est ce qu'on appelle le first click free : https://support.google.com/webmasters/answer/74536?hl=fr

En théorie, en faisant une recherche stricte sur une portion représentative de contenu, on est en mesure, via une recherche, de vérifier ou non l'existence du dit contenu sur Google.
 
Nouveau WRInaute
C'est vrai Google Books peut poser problème...

J'avais vu un reportage assez flippant et polémique sur Google Books...il semblerait qu'un très grand nombre d'ouvrages aient été purement et simplement scannés par Google...quand on est le leader et qu'on définit les règles du bien et du mal sur le net on peut se permettre de bafouer déontologie et morale concernant les droits d'auteurs !
 
WRInaute accro
getbetter a dit:
purement et simplement scannés par Google...quand on est le leader et qu'on définit les règles du bien et du mal sur le net on peut se permettre de bafouer déontologie et morale concernant les droits d'auteurs !
Non pas vraiment car il applique en l'espèce une règle plus restrictive sur le droit d'auteurs pour les ouvrages français. Comprend par là qu'il n'autorise pas la consultation plus tardivement que la BNF par exemple qui est hautement qualifiée pour ce qui est du respect des droits d'auteurs en France.
Pour les ouvrages récents il applique le principe de la "courte citation" CAD que pour une recherche donnée il va te produire une ou deux pages consultables de l'ouvrage sous droits d'auteur et te masquera le reste. Il n'en reste pas moins qu'en jonglant bien tu peux consulter (en plusieurs fois) la totalité de l'ouvrage mais c'est un autre problème.

Ce qui est en revanche est beaucoup plus discutable et pénalement possiblement condamnable est la revente de copie d'ouvrages tombés dans le domaine public. La parade que je pense qu'ils ont du mettre en place se trouve dans le fait qu'ils ne doivent vendre que la "repro" du livre (donc les services qu'ils ont mis en oeuvre) mais pas le contenu du livre .... (sujet intéressant et sensible par ailleurs)

Pour en finir avec GGB, qui est rarement débattu, pense que leur "oeuvre de numérisation", avait surtout, je pense, à la base, comme objectif d'avoir sous la main un corpus linguistique puissant permettant de se familiariser avec la langue ciblée. Tu notera au passage que toutes les anciennes chartes manuscrites ou les ouvrage enluminé du moyen-age en son totalement absent malgré des accord de partenariat avec les plus grosse bibliothèques du monde. Donc le but était il de mettre a disposition un recueil complet et exhaustif des ouvrages disponibles sur la planète ou de constituer une base de données textuelle du corpus mondial a des fins mercantiles via Tesseract (OCR applicable uniquement a des ouvrages non manuscrit) ? On peut se poser des questions ....

Pour en revenir au sujet, je te conseille de te pencher sur les dispositions légales qui encadrent la reprise d'un contenu texte d'une revue et si dans le respect de la lois tu est en mesure de republier des citations il te sera profitable de les commenter a ta sauce pour que cela constitue une plu valu réel pour l'ouvrage cité. Si tel est le cas tu ne devrais pas être embêté avec le DC. Note d'ailleurs qu'a ce stade, publier une image de la citation est encore un meilleur principe car c'est ton contenu qui fera l'objet d'une indexation et l'image du magazine (lisible) n'en sera qu'une illustration.

Si ton objectif est juste de reproduire le texte sans apport supplémentaire je pense que tu sort du cadre viable.
 
Discussions similaires
Haut