Google indexe des faux fichiers warez sur mon site
10 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Google indexe des faux fichiers warez sur mon site
Bonjour,
je suis webmaster du site www.corneilleonline.com, un site que j'ai créé il y a 3 ans à peu près et ça fait super longtemps que je ne l'ai pas mis à jour (à part le contenu).
Et ça doit faire des mois que mon hébergeur me rouspète car mon site demande trop de processus apache au serveur ce qui ralentit la globalité du serveur, alors qu'en fait c'est impossible car je n'ai vraiment pas beaucoup de visiteurs (faut l'avouer, Corneille n'a pas plus aucune actualité en ce moment).
Et en regardant les log apache et les log erreurs, j'ai remarqué que Google indexe comme un malade depuis des mois des fichiers warez qui n'existent même pas sur mon site.
Et maintenant ça apparaît sur Google :
http://www.google.com/search?hl=en&safe ... tnG=Search
Comment arrêter ce problème ?
Je ne veux pas bloquer Googlebot, car je voudrais toujours qu'il indexe mes vrais pages.
D'ailleurs, il n'y a pas que Google, mais Yahoo aussi indexe ses mauvaises pages.
Suis-je victime d'un virus ?
Merci de bien vouloir m'aider!!
je suis webmaster du site www.corneilleonline.com, un site que j'ai créé il y a 3 ans à peu près et ça fait super longtemps que je ne l'ai pas mis à jour (à part le contenu).
Et ça doit faire des mois que mon hébergeur me rouspète car mon site demande trop de processus apache au serveur ce qui ralentit la globalité du serveur, alors qu'en fait c'est impossible car je n'ai vraiment pas beaucoup de visiteurs (faut l'avouer, Corneille n'a pas plus aucune actualité en ce moment).
Et en regardant les log apache et les log erreurs, j'ai remarqué que Google indexe comme un malade depuis des mois des fichiers warez qui n'existent même pas sur mon site.
Et maintenant ça apparaît sur Google :
http://www.google.com/search?hl=en&safe ... tnG=Search
Comment arrêter ce problème ?
Je ne veux pas bloquer Googlebot, car je voudrais toujours qu'il indexe mes vrais pages.
D'ailleurs, il n'y a pas que Google, mais Yahoo aussi indexe ses mauvaises pages.
Suis-je victime d'un virus ?
Merci de bien vouloir m'aider!!
cthierry a écrit:Tu as regardé sur le serveur pour voir si on ne t'a pas mis des fichiers à ton insu. =>forum_old semble avoir pas mal de monde dedans.
Non justement, il n'y a rien, c'était un répertoire où il y avait l'ancienne config de mon forum, mais je l'ai effacé il y a 3-4 mois. Ce répertoire n'existe plus sur mon serveur.
J'ai vérifié, aucun de ces fichiers n'a pu être mis dans mon serveur.
Je me permets de remonter ce topic car je suis toujours bloqué avec mon problème.
N'y a-t-il personne d'autre qui pourrait m'aider ?
Est-ce un cas qui n'a jamais été vu avant ?
Si vous n'avez pas de solution à ce problème, connaissez-vous des sites dans lesquelles je pourrais trouver d'autres informations qui pourraient m'aider ?
Merci d'avance.
N'y a-t-il personne d'autre qui pourrait m'aider ?
Est-ce un cas qui n'a jamais été vu avant ?
Si vous n'avez pas de solution à ce problème, connaissez-vous des sites dans lesquelles je pourrais trouver d'autres informations qui pourraient m'aider ?
Merci d'avance.
Visiblement les urls en question ont fourni un contenu un jour où l'autre --> http://66.102.9.104/search?q=cache:AoxI ... =clnk&cd=1
Au fait, pourquoi aujourd'hui ça renvoie vers http://127.0.0.1 ?
---> y'a une gestion d'erreur qui déconne là...
++
Au fait, pourquoi aujourd'hui ça renvoie vers http://127.0.0.1 ?
---> y'a une gestion d'erreur qui déconne là...
++
Justement, c'est impossible qu'il y ait ce genre de contenu car j'en ai pas mis. Donc je me demande s'il n'existe pas un robot qui fait croire qu'il y a du contenu pour indexer des pages de spam ?
Le redirection vers 127.0.0.1, c'est moi qui l'ai ajouté pour empêcher les robots de revenir sur ces pages (en espérant que ça fonctionne avec l'option "permanent").
J'ai ajouté ça dans mon htaccess :
Ca leur envoie une erreur 301.
Mais bon, j'ai ajouté ça la semaine dernière, et ça les empêche pas de toujours continuer à visiter ces "fausses" pages.
Le redirection vers 127.0.0.1, c'est moi qui l'ai ajouté pour empêcher les robots de revenir sur ces pages (en espérant que ça fonctionne avec l'option "permanent").
J'ai ajouté ça dans mon htaccess :
- Code: Tout sélectionner
RedirectMatch permanent /forum_old/(.*)$ http://127.0.0.1
Ca leur envoie une erreur 301.
Mais bon, j'ai ajouté ça la semaine dernière, et ça les empêche pas de toujours continuer à visiter ces "fausses" pages.
wullon a écrit:301 n'est pas une erreur.
...c'est un "code d'état"
</geek>
Plus sérieusement:
Fichier robots.txt à la racine du site...
- Code: Tout sélectionner
User-agent: *
Disallow: /forum_old/
Au niveau de .htaccess:
- Code: Tout sélectionner
RewriteRule ^forum_old/(.*).html$ err410.php [L]
Dans err410.php:
- Code: Tout sélectionner
<?php header("HTTP/1.1 410 Gone"); ?>
--> la désindexation devrait être rapide.
PS: Si ça traîne, repère les pages qui restent indexées et fais des liens vers ces pages (parceque si Google n'a pas de liens vers ces pages, il n'ira pas les visiter, donc ne verra pas qu'il y'a un code 410
@++
Très intéressant tout ca...
je comprend mieux des erreurs 404 que j'ai souvent;
si j'ai bien compris, google continu de chercher des pages qui n'existent plus MEME si il n'y a pas de liens vers ces pages !
Je comprend bien le truc du dissalow /repertoire/,
mais que faire si c'est des fichiers par-ci par-là ?
Faire du rewrite pour chacun d'entre eux ?
Je vais essayer pour voir...
je comprend mieux des erreurs 404 que j'ai souvent;
si j'ai bien compris, google continu de chercher des pages qui n'existent plus MEME si il n'y a pas de liens vers ces pages !
Je comprend bien le truc du dissalow /repertoire/,
mais que faire si c'est des fichiers par-ci par-là ?
Faire du rewrite pour chacun d'entre eux ?
Je vais essayer pour voir...
10 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Liens et référencement : techniques de base
- Yahoo Audio Search
- Comment Google indexe et classe les documents
- Google indexe plus de 8 milliards de pages
- Google crawle les fichiers CSS
- Combien Google indexe de pages ?
- Contraintes d'emplacement du Sitemap
- Référencement : gestion des redirections par Yahoo
- Google Images indexe 2 187 212 422 images
- Googlebot, le robot d'indexation de Google
Consultez la description détaillée des produits ou services de Google suivants : Google Mini, Googlebot
- Ancienneté d'un site dans Google
Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités





le forum