Quel(s) outil(s) pour vérifier qu'on ne fait pas de contenu dupliqué ?

Nouveau WRInaute
Bonjour à tous et à toutes,

(Tout d'abord, désolé si je ne suis pas dans la bonne section pour poser ma question, mais je ne sais pas trop où la poser... :roll: )
Je suis en train de faire un site pour un client. En fait il a déjà été fait par un autre infographiste/webmaster freelance, mais en faisant une recherche je me suis aperçu que pour le texte, il ne s'était pas fait c... et qu'il avait fait un copier/coller d'autres sites et du coup, le site du client est mal référencé (malgré 600€/mois d'Adwords, mais ça je m'en occuperai plus tard).
Je voudrais donc refaire le site, notamment le texte, en m'inspirant des sites des concurrents du client. Comme je ne veux pas tomber dans les mêmes travers que mon prédécesseur, je rédige donc moi-même les textes. Cependant, comme je m'inspire des sites des concurrents du client, je suis forcément influencé par eux.

Je voudrais donc savoir s'il existe des outils (en ligne ou en logiciels) qui permettent de vérifier qu'on a pas (trop) fait de copier/coller d'autres sites afin que Google ne considère pas mon contenu comme dupliqué et donc ignoré.

Dans ce reportage sur Envoyé Spécial, j'avais vu que maintenant les profs (du collège à la fac) ont ce genre d'outils car la très grande majorité des élèves vont "pomper" des articles sur Internet (notamment Wikipédia) quand ils doivent rendre un devoir, un dossier, un mémoire. J'avais vu que dans une fac (je ne sais plus laquelle), pour leur mémoire, thèse, les étudiants ne devaient pas dépasser un pourcentage (10 ou 20 %) de "copier/coller", sans citer les auteurs/sources, autrement ils ne passaient même pas devant le jury.

J'imagine que ce genre d'outils doit exister pour quand on rédige du contenu sur Internet. Je voulais aussi savoir quel seuil de copier/coller il ne fallait pas dépasser pour que Google ne considère pas mon contenu comme dupliqué et donc ignoré.

D'avance merci pour vos réponses.
Bonne journée à vous :wink:
 
WRInaute accro
Il ne faut pas dépasser entre 5 et 10%
Les éléments que tu met entre des balises < em > peuvent être considérés comme des citations et donc ne pas être considérés comme du DC
Il faut remplacer des mots par des synonymes mais aussi intercaler des morceaux de phrases entre les différentes parties du texte pour que les parties en DC ne soient pas à la même distance les unes des autres par rapport au site d'origine. Parfois mettre une virgule et ajouter une petite précision peut suffire.
Une mise en forme totalement différente du texte d'origine peut aussi aider.
 
Nouveau WRInaute
Par contre, je viens de faire le test sur Positeo... Il me dit 12,73% de contenu dupliqué. D'accord... sauf que quand je vois les mots en gras (donc je suppose "dupliqué" pour lui), je vois des mots comme :
- donc avec
- C'est
- sa
- premier
- façades
Autant le dernier ("Façades") je comprends qu'il me dise qu'il est dupliqué (bien que je sois obligé de l'utiliser puisque c'est le sujet de la page), mais les autres ("donc avec", "c'est", "sa" etc...) ...
Du coup, si au début j'étais très enthousiaste d'avoir (enfin) un outil pour vérifier le contenu dupliqué (merci (sans ironie aucune) à Winsa), là..., après un test..., je suis plus que sceptique sur sa pertinence (et de son utilité et de ses résultats).
Si on va par là, vu la quantité de textes qu'il y a dans le monde, en langue française et sur Internet, on duplique forcément du texte aux yeux d'un tel outil (et peut-être même de Google) !!
 
WRInaute discret
Sur Positeo le texte apparaitra dans un encadré rouge si le contenu est dupliqué. Si ce n'est pas le cas l'encadré sera vert. ;)
 
Discussions similaires
Haut