Messages: 13

Enregistré le: 17 Oct 2014

Message le Sam Mai 16, 2015 8:44

Bonjour

Depuis quelques jours je viens de constater que quelqu'un copie mes pages html pour les ajouter sur des sites qu'il a piraté (pour le moment j en ai trouvé 4) avec une redirection sur son site. De ce fait google référence les sites piraté avec les titres de mes pages.

Comment éviter cela.

Mon site est 1001Chaussures.com

Merci de votre aide

Nicky
Haut
18 Réponses
Messages: 1438

Enregistré le: 11 Déc 2012

Message le Sam Mai 16, 2015 12:32

Je ne vois pas comment, même en retirant tes pages du web, certaines seront toujours sur archive.org
En fait si il y a une facon d'empecher ca, copie le texte de tes articles dans photoshop pour en faire une image.
Ensuite mets cette image a la place de ton texte sur tes pages.
Bref je ne vois pas, le beurre et l'argent du beurre, etc. :-)
Haut
Messages: 18372

Enregistré le: 5 Juin 2006

Message le Sam Mai 16, 2015 12:44

Déclaration DMCA à Google
Haut
Messages: 93

Enregistré le: 25 Oct 2007

Message le Sam Mai 16, 2015 16:10

Bonjour,

J'ai exactement le même problème : je m'en suis aperçu il y a deux jours, mais la duplication semble dater de début mai.
Un script php est installé à la racine d'un site officiel d'une agglomération, qui repompe systématiquement les milliers de pages de mon site. Ces pages sont donc indexées dans Google avec mon contenu (url du type www.agglo-x.fr/script.php?url=xxx), mais redirigent en fait vers un site tout pourri de vente de vêtements soit disant anglais, mais hénergé en Suède, et avec un whois chinois...

je ne sais pas si ça peut t'être utile, mais pour ma part, j'ai commencé par interdire l'IP du site qui duplique dans mon htaccess (parce que les logs montrent que le script continue à se servir...).
J'ai envoyé un message au webmaster du site agglo-x.fr pour qu'il retire ce script (pas de réponse pour l'instant).
J'ai fait une déclaration de spam auprès de Google. La déclaration DMCA ne semble pas appropriée pour ce genre de problème, parce qu'il faut énumérer chaque url qui porte atteinte au copyright : alors quand il y en a des milliers...

Ce qui est le plus écoeurant, c'est que ce mongol d'algorithme de Google n'est pas capable de constater avant indexation que le contenu est dupliqué. Certaines de mes pages ont 6 ou 7 ans d'existence : Google a indexé les copies, et relégué les miennes en 3 ou 4eme page !!! Complètement débile.

Si d'autres personnes ont des conseils, je suis également preneur !

Jerome
Haut
Messages: 12288

Enregistré le: 23 Nov 2005

Message le Sam Mai 16, 2015 16:36

La redirection se fait de quelle façon ? JS ? 301/302 ?
Haut
Messages: 93

Enregistré le: 25 Oct 2007

Message le Sam Mai 16, 2015 17:17

UsagiYojimbo a écrit:La redirection se fait de quelle façon ? JS ? 301/302 ?


Je ne sais pas à vrai dire.
Si tu tapes la requête 'jeans pimlico', le site incriminé est en position 1 par exemple : si tu as deux secondes... :wink:
Haut
Messages: 93

Enregistré le: 25 Oct 2007

Message le Sam Mai 16, 2015 17:18

Enfin a priori ça ne peut pas être du 301 sinon Google n'indexerait pas la page qui fait la redirection ?
Haut
Messages: 12288

Enregistré le: 23 Nov 2005

Message le Sam Mai 16, 2015 17:27

Le système fait des 302, d'où le souci. A ta place, je ne bloquerais pas l'IP, mais je renverrais une page vide. Et je ferrais davantage qu'envoyer un mail au site qui est utilisé à ces fins : j’appellerais.
Haut
Messages: 13

Enregistré le: 17 Oct 2014

Message le Sam Mai 16, 2015 17:45

Salut Jerome

Oui, c est bien la même choses, moi il redirige sur un site de chaussures :(

Maintenant il faut voir comment bloquer cela

Nicky
Modifié en dernier par Marie-Aude le Dim Mai 17, 2015 0:58, modifié 1 fois.
Raison: Suppression de la citation inutile du message précédent en entier
Haut
Messages: 93

Enregistré le: 25 Oct 2007

Message le Sam Mai 16, 2015 17:51

UsagiYojimbo a écrit:Le système fait des 302, d'où le souci. A ta place, je ne bloquerais pas l'IP, mais je renverrais une page vide. Et je ferrais davantage qu'envoyer un mail au site qui est utilisé à ces fins : j’appellerais.


Merci de l'info. Evidemment c'est une administration : je viens d'appeler et ça sonne dans le vide. Je ferai le forcing lundi.

En bloquant l'IP, mon serveur renvoit quand même la page 'Forbidden You don't have permission to access / on this server.' habituelle. En quoi est ce qu'il serait préférable que cela soit une page entièrement vide ?
Merci de tes conseils.
Haut
Messages: 13

Enregistré le: 17 Oct 2014

Message le Sam Mai 16, 2015 17:54

La ils ont pompé une page du comparateur Leguide
Modifié en dernier par Marie-Aude le Dim Mai 17, 2015 0:59, modifié 1 fois.
Raison: Suppression de la citation inutile du message précédent en entier
Haut
Messages: 93

Enregistré le: 25 Oct 2007

Message le Sam Mai 16, 2015 17:58

Tu parles de la requete ci-dessus ? Non, c'est une page de mon site pas de Leguide (mon site est aussi un comparateur/guide).
Modifié en dernier par Marie-Aude le Dim Mai 17, 2015 0:59, modifié 1 fois.
Raison: Suppression de la citation inutile du message précédent en entier
Haut
Messages: 12288

Enregistré le: 23 Nov 2005

Message le Sam Mai 16, 2015 18:00

A ta place, je ne bloquerais pas totalement l'Ip, mais je renverrais une page blanche si c'est celle-ci qui appelle ton url. Mais la meilleure solution consiste à faire le forcing auprès du site qui participe (a priori) sans le vouloir au problème :

-> Suppression du script
-> Désindexation de toutes les url associées
Haut
Messages: 93

Enregistré le: 25 Oct 2007

Message le Sam Mai 16, 2015 18:16

Merci, c'est ce que je vais faire. Le site de cette agglomération française est hébergé en Grand-bretagne manifestement et très logiquement... Pour peu que le webmaster ou le créateur du site soit anglais, ça va pas faciliter les choses...
Théoriquement, un disallow /script.php dans robots.txt devrait désindexer les pages non?
Modifié en dernier par Marie-Aude le Dim Mai 17, 2015 0:59, modifié 1 fois.
Raison: Suppression de la citation inutile du message précédent en entier
Haut
Messages: 13

Enregistré le: 17 Oct 2014

Message le Sam Mai 16, 2015 18:23

Moi de mon cote je viens d envoyer un mail aux 4 sites, c est aussi des sites anglophones, j ai ajouté un screen shot de la page google avec quelques pages à problèmes et en leur indiquant qu ils ont été piraté.

J attend leur retour
Haut
Messages: 12288

Enregistré le: 23 Nov 2005

Message le Sam Mai 16, 2015 18:45

Emorej a écrit:Le site de cette agglomération française est hébergé en Grand-bretagne manifestement


Je suis pas sûr : http://whois.domaintools.com/agglo-saumur.fr

Pour le reste, un disallow va surtout empêcher le robot de repasser sur ces pages pour prendre en compte la modification, elles resteront en l'état. Mieux vaut un noindex : http://robots-txt.com/ressources/robots-txt-noindex/
Haut
Messages: 93

Enregistré le: 25 Oct 2007

Message le Sam Mai 16, 2015 19:03

Oui tu as parfaitement raison pour la localisation. C'est mon extension tcpiputils de Chrome qui m'affiche quelque chose en UK mais elle se trompe.

Et merci beaucoup pour cette directive noindex du robots.txt que je ne connaissais pas !
Haut
Messages: 93

Enregistré le: 25 Oct 2007

Message le Lun Mai 18, 2015 16:37

Bonjour.
Suite de l'aventure.
Pour ma part, ce matin, Google a supprimé de son index toutes les pages pompées et référencées par le script.
Je ne sais pas si c'est un effet de ma déclaration de spam du 14/05, ou une manifestation normale de l'algo de Google s'apercevant de cette injection d'url.
Dans le doute, Nicky, je te conseille de faire une déclaration de spam auprès de Google si ce n'est déjà fait.

Par contre mes propres pages déclassées n'ont pas encore retrouvé leurs positions.

Le script lui est encore en place puisque mes logs enregistrent encore des visites de l'IP incriminée. Le webmaster ne sera joignable que demain.
Bon courage.
Haut
Messages: 13

Enregistré le: 17 Oct 2014

Message le Mer Mai 20, 2015 16:20

Salut Jerome,

Je viens de faire une déclaration de site avec logiciel malveillant, pour les 3 sites piratés, mais j ai aussi contacté les webmasters mais pour le moment pas de retour de leur part.

nicky
Haut