Ralentissement sur le forum -> raison :aspirateur de site


Mumuri
WRInaute accro
WRInaute accro
 
Messages: 1792
Inscription: Mer Nov 03, 2004 10:50

Ralentissement sur le forum -> raison :aspirateur de site

Message le Ven Aoû 19, 2005 12:11

Voila en regardant les stats de mon site hier, je suis tombé sur çà
Code: Tout sélectionner
Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)

le referrer venant d'un post sur WRI.

Httrack est un aspirateur de site web, ca veut dire que y'a de fortes chances que des gars lancent un aspirateur de site pour repomper le site et les articles, et que ca déborde ensuite sur le forum, puis sur le www, des posteurs.Résultat une grosse saturation du site et des PHPbb critical error à foison pour tous les autres posteurs.

Solution bannir les user agent contenant HTTrack, y'a d'autres solutions qui consiste à mettre des liens vides dans la page pour voir s'ils sont aspiré ...'a voir'(ceci dit si googlebot crawle les liens vides , il vaudrait mieux pas le bannir)


Borower
WRInaute accro
WRInaute accro
 
Messages: 2151
Inscription: Lun Avr 18, 2005 20:58

Message le Ven Aoû 19, 2005 13:18

Tu pense que c'est le site de WRI qui ce fait aspirer ou le tient?

En fait javais lu sur un site, qu' il fallait ecrire un lien invisible pour une personne.
Si la page est demandé (ici ce sera le cas pour un aspirateur de page) il faut banir l'IP qui ai passé sur cette adresse URL.


Mumuri
WRInaute accro
WRInaute accro
 
Messages: 1792
Inscription: Mer Nov 03, 2004 10:50

Message le Ven Aoû 19, 2005 13:20

en fait j'ai déduit que WRI s'était fait aspiré parce que la page principale de mon site avait été aspiré par un lien en provenance de WRI.

donc pour simplifier je pense que WRI s'est fait aspirer ...

et je vois plus un bannissement par user agent et ensuite par ip


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15893
Inscription: Ven Avr 19, 2002 19:51

Message le Ven Aoû 19, 2005 13:28

j'ai pourtant une ligne
Code: Tout sélectionner
RewriteCond %{HTTP_USER_AGENT} HTTrack [OR]
dans mon .htaccess
faudrait que je fasse des tests...


Vladkergan
WRInaute discret
WRInaute discret
 
Messages: 97
Inscription: Jeu Déc 16, 2004 15:34

Y'a juste un problème...

Message le Ven Aoû 19, 2005 13:33

...le hic c'est que dans Httracks on peut paramétrer le user-agent (je le sais pour l'avoir essayé il y a peu).

Image

Il est ici possible de modifier le texte situé dans les listes déroulantes et d'y mettre ce qu'on veut.
Dernière édition par Vladkergan le Ven Aoû 19, 2005 13:49, édité 1 fois.

unpassant
WRInaute impliqué
WRInaute impliqué
 
Messages: 475
Inscription: Mar Fév 15, 2005 17:25

Message le Ven Aoû 19, 2005 13:48

vous avez une petite liste des aspirateurs a bannir?


Ohax
WRInaute accro
WRInaute accro
 
Messages: 6392
Inscription: Lun Juil 05, 2004 13:30

Message le Ven Aoû 19, 2005 13:51

J'ai un sujet pour vous ;-)

http://www.webrankinfo.com/forums/viewtopic_24860.htm


Pour ma part j'ai opté pour le bannissemment htaccess + le script php

ça marche plutôt bien :D


Mumuri
WRInaute accro
WRInaute accro
 
Messages: 1792
Inscription: Mer Nov 03, 2004 10:50

Re: Y'a juste un problème...

Message le Ven Aoû 19, 2005 16:05

Vladkergan a écrit:...le hic c'est que dans Httracks on peut paramétrer le user-agent (je le sais pour l'avoir essayé il y a peu).

Image

Il est ici possible de modifier le texte situé dans les listes déroulantes et d'y mettre ce qu'on veut.


c'est sur mais ca permet au moin de bannir celui qui utilise le logiciel avec les options par défaut ;)


Vladkergan
WRInaute discret
WRInaute discret
 
Messages: 97
Inscription: Jeu Déc 16, 2004 15:34

Oui...

Message le Ven Aoû 19, 2005 16:08

...ca a d'ailleurs l'air d'être le cas sur ton site vu le user-agent que tu as relevé.


Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité