Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
29 messages
• Page 1 sur 2 • 1, 2
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

YoyoS - WRInaute accro

- Messages: 3835
- Inscription: 14 Sep 2006
Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
Salut à tous,
Alors, je viens de terminer un petit outil qui va vous permettre de vérifier s'il existe une page dupliquée pour un texte ou une page de votre site. J'ai utilisé l'API Search que nous met à disposition Google et j'aimerais quelques feedbacks pour l'améliorer encore si possible
Madrileno m'a déjà fait quelques feedbacks et à joué le rôle de bêta testeur, merci à lui !
Au programme:
- Choix entre un texte ou une url en entrée.
- L'outil parcourt votre site à la recherche de contenu.
- L'outil scinde le texte fournit ou le texte récolté depuis votre site en morceaux pour effectuer plusieurs recherches sur google, ce qui améliore la detection.
- Gestion des sites encodés en UTF-8, ISO...
- Liens directs vers les tests effectués disponibles que vous pouvez ajouter en favoris.
- Groupe les résultats des multiples recherches google qui possèdent la même adresse.
- Affiche le pourcentage de mots clés reconnus par google comme dupliqués (en gras)
- Aperçu instantané d'un plagiat (fond et encadré en rouge (>=50%) ou vert (<50%) )
- Suivi des redirections 301 en cas de test sur une URL ne renvoyant pas un code 200. (Max 3 redirections)
Pour l'utilisation, vous pouvez afficher le mode d'emploi facilement. Sinon c'est rapide, vous entrez soit un texte, soit l'url d'une page à tester et c'est parti! . Exemple avec WRI qui a pas mal de DC
:

Voila l'outil de vérification de duplicate content. Qu'en pensez-vous ?
N'hésitez pas à reporter les éventuels bugs que vous trouverez ou améliorations possibles 
Si vous apercevez votre site dans les résultats de l'outil, n'ayez pas peur, c'est normal
. Je l'ai juste laissé à titre d'indication, je trouve plutôt normal de trouver les résultats de son site en premier sur google quand on fait une recherche. Et si vous ne voyez pas 100% pour votre site, c'est normal aussi 
NB: Si vous avez déjà visité positeo.com auparavant, n'oubliez pas de vider votre cache
CTRL + F5 !
Alors, je viens de terminer un petit outil qui va vous permettre de vérifier s'il existe une page dupliquée pour un texte ou une page de votre site. J'ai utilisé l'API Search que nous met à disposition Google et j'aimerais quelques feedbacks pour l'améliorer encore si possible
Madrileno m'a déjà fait quelques feedbacks et à joué le rôle de bêta testeur, merci à lui !
Au programme:
- Choix entre un texte ou une url en entrée.
- L'outil parcourt votre site à la recherche de contenu.
- L'outil scinde le texte fournit ou le texte récolté depuis votre site en morceaux pour effectuer plusieurs recherches sur google, ce qui améliore la detection.
- Gestion des sites encodés en UTF-8, ISO...
- Liens directs vers les tests effectués disponibles que vous pouvez ajouter en favoris.
- Groupe les résultats des multiples recherches google qui possèdent la même adresse.
- Affiche le pourcentage de mots clés reconnus par google comme dupliqués (en gras)
- Aperçu instantané d'un plagiat (fond et encadré en rouge (>=50%) ou vert (<50%) )
- Suivi des redirections 301 en cas de test sur une URL ne renvoyant pas un code 200. (Max 3 redirections)
Pour l'utilisation, vous pouvez afficher le mode d'emploi facilement. Sinon c'est rapide, vous entrez soit un texte, soit l'url d'une page à tester et c'est parti! . Exemple avec WRI qui a pas mal de DC

Si vous apercevez votre site dans les résultats de l'outil, n'ayez pas peur, c'est normal
NB: Si vous avez déjà visité positeo.com auparavant, n'oubliez pas de vider votre cache
- L.Jee
- WRInaute accro

- Messages: 7192
- Inscription: 11 Déc 2007
Re: Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
YoyoS a écrit:Madrileno m'a déjà fait quelques feedbacks et à joué le rôle de bêta testeur, merci à lui !
Il est vraiment partout ce Madri. Quand il n'est pas là cela se ressens et quand il est là cela se ressens aussi.
Ca à l'air sympa tout ça. Je check dans la journée et te ferai un retour
-

carole heinz - WRInaute accro

- Messages: 2855
- Inscription: 28 Fév 2007
Re: Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
un petit merci aussi à shelcko et à son topic initial, à moi-même pour l'idée du taux de gras et à zeb pour son début de script 
ça a l'air pas mal, ce qui serait sympa ce serait de rendre la source publique dans la mesure où la réflexion s'est déroulée ici sur WRI
ça a l'air pas mal, ce qui serait sympa ce serait de rendre la source publique dans la mesure où la réflexion s'est déroulée ici sur WRI
-

Madrileño - Madrileño

- Messages: 28404
- Inscription: 7 Juil 2004
Re: Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
YoyoS c'est un outil qui va aider pas mal de personnes, félicitations.
Merci à vous deux.
L.Jee a écrit:YoyoS a écrit:Madrileno m'a déjà fait quelques feedbacks et à joué le rôle de bêta testeur, merci à lui !
Il est vraiment partout ce Madri. Quand il n'est pas là cela se ressens et quand il est là cela se ressens aussi.![]()
Merci à vous deux.
-

Bigb06 - WRInaute occasionnel

- Messages: 496
- Inscription: 21 Mar 2007
Re: Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
C'est quoi le % de copie?
Parce que ca peut faire peur de voir plus de 80% de contenu dupliqué alors qu'on reprend 3 phrases d'un flux RSS dans une page...
Pour moi c'est pas encore totalement au point par rapport à la référence copyscape
Parce que ca peut faire peur de voir plus de 80% de contenu dupliqué alors qu'on reprend 3 phrases d'un flux RSS dans une page...
Pour moi c'est pas encore totalement au point par rapport à la référence copyscape
-

YoyoS - WRInaute accro

- Messages: 3835
- Inscription: 14 Sep 2006
Re: Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
@carole, j'avais pensé à faire l'outil bien avant les 3 topics (qui est une brique de mon prochain projet, demande a madri ^^)
Et je n'ai pas du tout utilisé le script de Zeb dont je trouve la méthode pas super bonne. Ces topics sont une pure coïncidence. La méthode de calcul sur le taux de mots en gras était la seule méthode à utiliser vu que c'est celle qui se rapporte le plus à une méthode de vérification manuelle... Je veux bien aider quelqu'un qui se casse la tête à réaliser un script mais lui donner une application terminée tout cuit dans le bec, faut pas pousser
Tu aimerais que je montre le code qui gère les mots en gras et calcule le pourcentage alors ? Mais pas tout le script quand même !
@Bigb06. Pour chaque résultat de recherche google, google met en gras un certain nombre de mots. C'est le pourcentage de mots en gras par rapport au snippet entier ! Et je trouve les mêmes résultats que copyscape, donc ca me semble être bon ? Qu'as-tu testé qui ne te semble pas correct ?
@Bigb06. Pour chaque résultat de recherche google, google met en gras un certain nombre de mots. C'est le pourcentage de mots en gras par rapport au snippet entier ! Et je trouve les mêmes résultats que copyscape, donc ca me semble être bon ? Qu'as-tu testé qui ne te semble pas correct ?
-

carole heinz - WRInaute accro

- Messages: 2855
- Inscription: 28 Fév 2007
Re: Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
YoyoS a écrit:@carole, j'avais pensé à faire l'outil bien avant les 3 topics (qui est une brique de mon prochain projet, demande a madri ^^)Et je n'ai pas du tout utilisé le script de Zeb dont je trouve la méthode pas super bonne. Ces topics sont une pure coïncidence
il ne s'agit pas de 3 topics mais d'un seul et unique topic (les 3 liens sont des liens vers 3 posts de ce topic).
non mais je vais pas t'embêter hein, peu importe.
par contre tu devrais quand même mettre à disposition une API ou quelque chose, pour l'instant ce n'est pas super pratique à utiliser; pour un annuairiste par exemple ton outil n'apporte rien, entre copier-coller la description à tester dans ton outil, ou directement dans google, je préfère encore directement copier-coller dans google (ou mieux: sélection > clic-droit > rechercher dans google ): plus rapide, plus pratique, plus transparent et surtout je ne "donne" pas mes descriptions à un "privé" (mode parano: on ne sait jamais vraiment ce que font tous ces outils de positionnement, antiDC etc avec toutes les données intéressantes qu'ils récoltent...)
donc sauf à donner la source (pour implémenter la même chose sur nos annuaires / sites de CP) ou à créer une API, je ne pense pas que cet outil nous soit très utile.
-

YoyoS - WRInaute accro

- Messages: 3835
- Inscription: 14 Sep 2006
Re: Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
L'avantage de l'outil c'est qu'on peut y coller un texte entier qui peut etre trop grand pour être collé dans Google directement. (Google limite à 32mots la recherche)
- L.Jee
- WRInaute accro

- Messages: 7192
- Inscription: 11 Déc 2007
Re: Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
carole heinz a écrit:je préfère encore directement copier-coller dans google (ou mieux: sélection > clic-droit > rechercher dans google )
Encore plus vite tu fais Ctrl+c, Ctrl+t, Ctrl+v
-

zeb - WRInaute accro

- Messages: 4560
- Inscription: 5 Déc 2004
Re: Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
carole heinz a écrit:Par contre tu devrais quand même mettre à disposition une API ou quelque chose, pour l'instant ce n'est pas super pratique à utiliser; pour un annuairiste par exemple ton outil n'apporte rien, entre copier-coller la description à tester dans ton outil, ou directement dans google, je préfère encore directement copier-coller dans google (ou mieux: sélection > clic-droit > rechercher dans google ): plus rapide, plus pratique, plus transparent et surtout je ne "donne" pas mes descriptions à un "privé" (mode parano: on ne sait jamais vraiment ce que font tous ces outils de positionnement, antiDC etc avec toutes les données intéressantes qu'ils récoltent...)
donc sauf à donner la source (pour implémenter la même chose sur nos annuaires / sites de CP) ou à créer une API, je ne pense pas que cet outil nous soit très utile.
Un peut les même remarques, l'outils est très propre mais pas utile en l'état et la limitation a 32 mots ne constitue pas un problème dans la mesure ou google limite la requête et fourni un résultat visible de suite.
Qui plus est ce genre d'outil ne présente d'intérêt que pour des webmaster donc l'impact est super limité.
Sinon c'est super propre et bien fait. On peut juste reprocher qu'il n'y ai pas un mode de réponse oui / non tout simple car c'est surtout ça qui compte.
-

YoyoS - WRInaute accro

- Messages: 3835
- Inscription: 14 Sep 2006
Re: Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
J'ai eu le cas ou google ne trouvait pas le contenu duppliqué car il se trouvait à l'intérieur du texte après les 32 premiers mots. Ici vu que le texte est coupé en morceaux et que plusieurs requêtes sont faites, l'analyse est plus fine et google trouve plus de choses !
Sinon les résultats sont classés par ordre de pourcentage décroissant. Donc si le premier n'est pas rouge, c'est bon
Sinon les résultats sont classés par ordre de pourcentage décroissant. Donc si le premier n'est pas rouge, c'est bon
-

dop20vt - WRInaute impliqué

- Messages: 586
- Inscription: 23 Juin 2007
Re: Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
http://www.positeo.com/check-duplicate-content/?u=http://www.jullu.fr
Ma page http://www.jullu.fr arrive en 2ème position avec 76% de DC !! Ca ne devrait pas être 100% en toute logique ?? ^^
En 1er avec 79% de DC c'est une page interne qui sort
Sinon présentation et technique impec
Je suis un grand utilisateur du "chech position" !! C'est plus dans la philosophie de l'outil que ca pêche encore un peu !!
Ma page http://www.jullu.fr arrive en 2ème position avec 76% de DC !! Ca ne devrait pas être 100% en toute logique ?? ^^
En 1er avec 79% de DC c'est une page interne qui sort
Sinon présentation et technique impec
-

vincentdezone - WRInaute impliqué

- Messages: 864
- Inscription: 2 Jan 2009
Re: Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
l'outil est bien présenté et clair mais ce serait cool que ce ne soit pas qu'un outil de diagnostic. Je fais quoi ensuite quand je sais que mon contenu est dupliqué à 80% ? Je panique ? Ou je panique uniquement à partir de 95% ? Et quand c'est une page interne à mon site qui sort, y'a un risque ? Il manque pas grand chose pour que ce soit un super outil pour les webmasters. En tous les cas je l'ai mis en signet pour voir la suite.
-

labelandco - WRInaute discret

- Messages: 83
- Inscription: 28 Fév 2010
Re: Outil de vérification de plagiat ou de duplication de contenu (duplicate content)
je ne voudrais pas jouer les perturbateurs mais il y a un outil très efficace et particulièrement pertinent dans ce domaine :
copyscape
Cela étant je félicite aussi cette initiative on a jamais de trop d'outil qui permettent de retrouver des plagistes
copyscape
Cela étant je félicite aussi cette initiative on a jamais de trop d'outil qui permettent de retrouver des plagistes
29 messages
• Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Outil webmaster Duplication contenu
- Duplication de contenu outil pour voir si site concerné
- Plagiat et duplicate content
- verification de duplicate content possible ?
- Duplicate Content, Outil d'analyse !?
- Piratage de contenu et duplicate content
- Contenu libre / Référencement / Duplicate content /
- Vente de contenu, risque de duplicate content ?
- Outil pour trouver duplicate content sur chaine de caractère
- Eviter le duplicate content (similarité du contenu)
- La traduction d'un contenu peut-elle générer une pénalité de duplicate content ?
- Le contenu dupliqué : impact et solutions pour le référencement
- Nouvelle étude de WebRankInfo : les mots-clés et le référencement
- Google Webmaster Tools alerte en cas de pb de duplicate content
- Comment indiquer une URL canonique dans l'entête HTTP
- Les sites Bounce Pad, pénalisés par le filtre anti-duplicate content de Google ?
- La balise d'URL canonique inter-sites
- La balise d'URL canonique : pour réduire les contenus dupliqués
- Détection de pages similaires
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
