HELP 400 pages spammées

Nouveau WRInaute
Bonjour,

Un appel à l'aide : je me rends compte ce matin qu'au moins 400 pages de mon site sont spammées :

Concrètement : dans google je trouve 400 pages avec un format http://www.monsite.com/www.unautresite.com

Les pages affichent tout simplement le même contenu que mes pages originales, merci le duplicate !!

Le site http://www.unautresite.com n'existe pas par ailleurs.

Je n'ai aucune idée d'où ca vient, je ne savais pas non plus que ce type de sangsue existait.

D'où un grand appel à l'aide, et urgent : 400 pages en duplicate ca peut faire mal.

Concrètement : est-ce un problème connu, et comment s'en défaire ??
 
WRInaute accro
chai pas mais le plus rapide est de créer un .htaccess avec:


Code:
# file not found
ErrorDocument 400 http://www.monsite.com/noindexnofollow.html
ErrorDocument 403 http://www.monsite.com/noindexnofollow.html
ErrorDocument 404 http://www.monsite.com/noindexnofollow.html
RedirectPermanent /www.unautresite.com http://www.monsite.com/noindexnofollow.html

<IfModule mod_speling.c>
CheckSpelling Off
</IfModule>

en suite créer une page HTML qui comporte le code suivant:

Code:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html><head>
<meta name="ROBOTS" content="NOINDEX, NOFOLLOW">
<meta content="text/html; charset=ISO-8859-1" http-equiv="content-type"><title></title>
</head><body>
</body></html>

déjà ça devrait aider, bien plus rapide que GWT ou quelqu'autre fichier ROBOTS.TXT.
 
WRInaute accro
smorge a dit:
mipc a dit:
comme ça si google indexe des pages qui n'existe pas, elle ne seront jamais indexer

Alors moins il en indexe plus, plus c'est moins indexé, c'est ça ?

:lol:

he ça mes arriver, google à inventé des pages qui n'ont jamais existé, et j'en ai chier pour les virés avant de comprendre d'ou vennait le problème.
 
Nouveau WRInaute
Merci mipc !

Et ce serait quoi alors l'explication ?
Cela t'est arrivé avec joomla ?

Encore merci pour ton aide.
 
WRInaute accro
dupond33 a dit:
Merci mipc !

Et ce serait quoi alors l'explication ?
Cela t'est arrivé avec joomla ?

Encore merci pour ton aide.


non non, en fait voila un jour j'avais fait un liens vers google maps, genre:

http://maps.google.fr/maps/place?cid=12137504224364543310&q=luminais+o ... n=0,0&z=13

et j'avais correctement taper le liens, j'ai vérifier le liens via le code source afficher de firefox et que se soit via FIREBUG ou WEBDEVLOPPER j'avais bon, sauf que celui-ci avait invté des truc genre: http://monsitewaibe.fr/maps?f=q&source=s_q&hl=fr&geocode=&q=maintenanc ... cfJdA&cd=1

ou encore d'autre du même genre:

http://monsitewaibe.fr/depannage-informatique-paris.jpg\x26imgrefurl\x3dhttp://mipc.fr/\x26usg\x3d__TMDeqBA-rjUNUV9vIBIFAOx404s\x3d\x26h\x3d236\x26w\x3d1049\x26sz\x3d55\x26hl\x3den\x26start\x3d1

http://monsitewaibe.fr/.

http://monsitewaibe.fr/.Plus vite ce sera fait, moins vous risquez de perdre vos données.

http://monsitewaibe.fr/cse

pour ses trois dernières, je sais comment et presque pkoi cet imbécile de google les à inventer, les deux premières il les à inventé depuis son cache, oui oui son cache à lui comme ça, surtout http://monsitewaibe.fr/. , surtout que dans le cache c'est marquer http://monsitewaibe.fr/ . et pas http://monsitewaibe.fr/., il a zapé l'espace entre / et . , de même pour CSE, ça vient de -h/t/t/p/://w/w/w/./g/o/o/g/l/e/./c/o/m/webmasters/tools/richsnippets?url=mipc.fr&view= , liens qu'il à réfrencer comme ça pendant un moment, alors que j'avais juste tapé le liens.


et j'en oublie surement.
 
WRInaute passionné
ça ne serait pas plus simple d'effectuer un contrôle du lien du navigateur VS url réelle de la page et d'effectuer une redirection ?
 
Nouveau WRInaute
Au final, une bonne technique de sioux pour mettre tout le site en duplicate via une erreur de débutant.
 
Nouveau WRInaute
Victime black hat : url multiples / in line linking

Au final, si cela peut aider quelqu'un, un rapide retour - J'ai également changé le titre du post.

Je sais désormais qu'en cas de coup dur il vaut mieux avoir des vrais contacts réels, que virtuels, ou qu'attendre de l'aide des forums.

Donc : j'ai été victime d'une technique black hat, url multiples / in line linking :

Des milliers de url fausses, crées automatiquement et utilisant mon ndd, en exploitant une faille d'un vieux joomla, et qui reprenait exactement le contenu de mes pages. Du coup ici le canonical s'avère inefficace.

On se retrouve du jour au lendemain avec des millers de title duplicate dans GWT. Ces pages sont indexées, dans mon cas, via un annuaire hacké. En corrigeant l'erreur avec un peu de programmation dans joomla, on remplace peu à peu ces contenus par des pages 404. En les bloquant ensuite via le robot on s'en sort. Mais il faut vite réagir, sinon galère.

L'objectif de la technique : plomber un site concurrent en créant du duplicate (voire du 404 en masse). J'espère que l'info servira parce qu'en francais je n'ai quasiment rien lu sur le sujet.

Un autre cas (en anglais) :

https://www.google.com/support/forum/p/Webmasters/thread?tid=5c22e65798 ... 7596&hl=en

Et l'explication : http://en.wikipedia.org/wiki/Inline_linking

En tous cas ceux qui travaillent pour flinguer celui des autres... Sympa.
 
WRInaute occasionnel
Re: Victime black hat : url multiples / in line linking

dupond33 a dit:
Je sais désormais qu'en cas de coup dur il vaut mieux avoir des vrais contacts réels, que virtuels, ou qu'attendre de l'aide des forums.
Welcome to the real life ! 8)

Sinon, je compatis avec toi ! Je n'étais même pas au courant de ce genre de pratique pour le moins abusive. C'est du sabotage pur et simple.

Question : C'est un dysfonctionnement propre à Joomla! ou c'est aussi connu sur d'autres CMS :?:
 
WRInaute accro
a bon ma solution de faire des redirections de chaque fausses pages, vers une pages blanche en noindex nofollow, n'était pas bonne!!!?
 
Discussions similaires
Haut