Google indexe des faux fichiers warez sur mon site

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

ly
Nouveau WRInaute
 
Messages: 5
Inscription: Lun Avr 09, 2007 13:29

Google indexe des faux fichiers warez sur mon site

Message le Lun Avr 09, 2007 13:39

Bonjour,

je suis webmaster du site www.corneilleonline.com, un site que j'ai créé il y a 3 ans à peu près et ça fait super longtemps que je ne l'ai pas mis à jour (à part le contenu).

Et ça doit faire des mois que mon hébergeur me rouspète car mon site demande trop de processus apache au serveur ce qui ralentit la globalité du serveur, alors qu'en fait c'est impossible car je n'ai vraiment pas beaucoup de visiteurs (faut l'avouer, Corneille n'a pas plus aucune actualité en ce moment).

Et en regardant les log apache et les log erreurs, j'ai remarqué que Google indexe comme un malade depuis des mois des fichiers warez qui n'existent même pas sur mon site.

Et maintenant ça apparaît sur Google :

http://www.google.com/search?hl=en&safe ... tnG=Search

Comment arrêter ce problème ?

Je ne veux pas bloquer Googlebot, car je voudrais toujours qu'il indexe mes vrais pages.

D'ailleurs, il n'y a pas que Google, mais Yahoo aussi indexe ses mauvaises pages.

Suis-je victime d'un virus ?

Merci de bien vouloir m'aider!! :oops:


cthierry
WRInaute accro
WRInaute accro
 
Messages: 2104
Inscription: Sam Jan 15, 2005 9:16

Message le Lun Avr 09, 2007 14:04

Tu as regardé sur le serveur pour voir si on ne t'a pas mis des fichiers à ton insu. =>forum_old semble avoir pas mal de monde dedans.

ly
Nouveau WRInaute
 
Messages: 5
Inscription: Lun Avr 09, 2007 13:29

Message le Lun Avr 09, 2007 14:27

cthierry a écrit:Tu as regardé sur le serveur pour voir si on ne t'a pas mis des fichiers à ton insu. =>forum_old semble avoir pas mal de monde dedans.

Non justement, il n'y a rien, c'était un répertoire où il y avait l'ancienne config de mon forum, mais je l'ai effacé il y a 3-4 mois. Ce répertoire n'existe plus sur mon serveur.
J'ai vérifié, aucun de ces fichiers n'a pu être mis dans mon serveur.

ly
Nouveau WRInaute
 
Messages: 5
Inscription: Lun Avr 09, 2007 13:29

Message le Jeu Avr 12, 2007 19:44

Je me permets de remonter ce topic car je suis toujours bloqué avec mon problème.

N'y a-t-il personne d'autre qui pourrait m'aider ?

Est-ce un cas qui n'a jamais été vu avant ?

Si vous n'avez pas de solution à ce problème, connaissez-vous des sites dans lesquelles je pourrais trouver d'autres informations qui pourraient m'aider ?

Merci d'avance.


HawkEye
Modérateur
Modérateur
 
Messages: 15029
Inscription: Lun Fév 23, 2004 12:33

Message le Jeu Avr 12, 2007 22:29

Visiblement les urls en question ont fourni un contenu un jour où l'autre --> http://66.102.9.104/search?q=cache:AoxI ... =clnk&cd=1

Au fait, pourquoi aujourd'hui ça renvoie vers http://127.0.0.1 ?

---> y'a une gestion d'erreur qui déconne là...

++

ly
Nouveau WRInaute
 
Messages: 5
Inscription: Lun Avr 09, 2007 13:29

Message le Jeu Avr 12, 2007 23:04

Justement, c'est impossible qu'il y ait ce genre de contenu car j'en ai pas mis. Donc je me demande s'il n'existe pas un robot qui fait croire qu'il y a du contenu pour indexer des pages de spam ?

Le redirection vers 127.0.0.1, c'est moi qui l'ai ajouté pour empêcher les robots de revenir sur ces pages (en espérant que ça fonctionne avec l'option "permanent").
J'ai ajouté ça dans mon htaccess :

Code: Tout sélectionner
RedirectMatch permanent /forum_old/(.*)$ http://127.0.0.1


Ca leur envoie une erreur 301.

Mais bon, j'ai ajouté ça la semaine dernière, et ça les empêche pas de toujours continuer à visiter ces "fausses" pages. :(


wullon
WRInaute accro
WRInaute accro
 
Messages: 3914
Inscription: Sam Sep 18, 2004 15:06

Message le Jeu Avr 12, 2007 23:19

301 n'est pas une erreur.
Désindexe proprement ces pages à la limite, avec un robots.txt + 404 (il y a peut-être une erreur plus appropriée).


HawkEye
Modérateur
Modérateur
 
Messages: 15029
Inscription: Lun Fév 23, 2004 12:33

Message le Ven Avr 13, 2007 7:10

wullon a écrit:301 n'est pas une erreur.

...c'est un "code d'état" ;)

</geek>

Plus sérieusement:

Fichier robots.txt à la racine du site...

Code: Tout sélectionner
User-agent: *
Disallow: /forum_old/


Au niveau de .htaccess:

Code: Tout sélectionner
RewriteRule ^forum_old/(.*).html$ err410.php [L]


Dans err410.php:

Code: Tout sélectionner
<?php header("HTTP/1.1 410 Gone"); ?>


--> la désindexation devrait être rapide.

PS: Si ça traîne, repère les pages qui restent indexées et fais des liens vers ces pages (parceque si Google n'a pas de liens vers ces pages, il n'ira pas les visiter, donc ne verra pas qu'il y'a un code 410 ;) ).

@++

ly
Nouveau WRInaute
 
Messages: 5
Inscription: Lun Avr 09, 2007 13:29

Message le Ven Avr 13, 2007 19:59

Merci pour ces conseils, je vais essayer tout ceci et vous dirai dans quelques jours si ça a fonctionné. :)


Ytz
WRInaute discret
WRInaute discret
 
Messages: 74
Inscription: Mer Mar 21, 2007 21:14

Message le Ven Avr 13, 2007 20:28

Très intéressant tout ca...
je comprend mieux des erreurs 404 que j'ai souvent;
si j'ai bien compris, google continu de chercher des pages qui n'existent plus MEME si il n'y a pas de liens vers ces pages !

Je comprend bien le truc du dissalow /repertoire/,
mais que faire si c'est des fichiers par-ci par-là ?
Faire du rewrite pour chacun d'entre eux ?

Je vais essayer pour voir...


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités