Script php Anti aspirateur.
- Eservice
- WRInaute passionné

- Messages: 1463
- Inscription: 18 Sep 2002
Bonsoir, une autre solution pour réduire au maximum le nombre de hits des aspirateurs, moins efficace que le script de renardrouge mais quand même valable : proposer le téléchargement de son site dans un fichier compressé ( 1 seul hit
)
-

Kmacleod - WRInaute accro

- Messages: 3418
- Inscription: 28 Nov 2002
BDgest, si tu as fait l'integration de GS et du SAA (Script Anti Aspi), je suis preneur.
Peut-être qu'olivier aussi dans une fonctionnalité de GS qui soit de tracer plusieurs robots comme d'en limiter l'acces
(en considérant qu'un aspirateur est une derivée d'un robot, dans son comportement et effet, pas dans sa fonctionnalité d'origine differente).
Peut-être qu'olivier aussi dans une fonctionnalité de GS qui soit de tracer plusieurs robots comme d'en limiter l'acces
(en considérant qu'un aspirateur est une derivée d'un robot, dans son comportement et effet, pas dans sa fonctionnalité d'origine differente).
- nono34
- Nouveau WRInaute

- Messages: 11
- Inscription: 21 Mar 2003
Bonjour,
Moi je voit ca du coté hebergeur personnellement, et voila le script que j'ai ajouter dans mon httpd.conf
C'est sur ca n'arrete QUE les aspirateurs de sites qui ne triche pas sur leur USERS AGENTS. Mais pour l'instant ca marche plutot pas mal.
Normalement on doit pouvoir incorporé cela dans le .htaccess
A vérifié.
Autre chose, il y a aussi le module apache mod_throttle pour limiter la bande passante consommé par IP.
Car à vrai dire les seuls qui consomme de la bande passante anormalement ce sont les aspirateur de site.
Mais j'ai peur de bloquer google et les autres moteurs de recherche avec ca...... genre limité 15 Mb par IP par jour....
Bruno
Administrateur systeme de
http://www.hebergementx-gratuit.com
Moi je voit ca du coté hebergeur personnellement, et voila le script que j'ai ajouter dans mon httpd.conf
- Code: Tout sélectionner
# Robots known or highly suspected of collecting email addresses for spam
RewriteCond %{HTTP_USER_AGENT} ^(autoemailspider|Bullseye|CherryPicker|Crescent|ecollector|EmailCollector|EmailSiphon|EmailWolf|ExtractorPro|fastlwspider|.*LWP|Digger|Microsoft.URL|Mozilla/3.Mozilla/2.01|Mozilla.*NEWT|NICErsPRO|SurfWalker|Telesoft|WebBandit|WebEMailExtrac|Zeus.*Webster) [NC,OR]
# Robots (sometimes called spiders) which regularly violate robots.txt
RewriteCond %{HTTP_USER_AGENT} ^(ADSARobot|.*almaden\.ibm|ASSORT|big.brother|bumblebee|Digimarc|FavOrg|FAST|.*fluffy|.*Girafabot|HomePageSearch|IncyWincy|NPBot|Openfind|OpenTextSiteCrawler|OrangeBot|Robozilla|ScoutAbout|.*searchhippo|searchterms\.it|sitecheck|UIowaCrawler|.*webcraft@bea\.com|WEBMASTERS|WhosTalking|WISEbot|Yandex) [NC,OR]
# Agents used for both good and bad purposes, such as sucking up bandwidth
# by downloading entire sites, or probing servers for security exploits.
RewriteCond %{HTTP_USER_AGENT} ^(ASPSeek|Deweb|Fetch|FlashGet|Teleport|TeleportPro|Getleft|GetURL|GetWebPage|.*HTTrack|KWebGet|libwww-perl|Mirror|NetAnts|NetCarta|netprospector|Net.Vampire|pavuk|PSurf|PushSite|reget|Rsync|Shai|SpiderBot|SuperBot|tarspider|Templeton|w3mir|web.by.mail|WebCopier|WebCopy|WebMiner|WebReaper|WebSnake|WebStripper|webvac|webwalk|WebZIP|Wget|XGET) [NC,OR]
# Miscellaneous (suspicious -- more information would be appreciated)
RewriteCond %{HTTP_USER_AGENT} ^(ah-ha|aktuelles|ATHENS|attache|bew|disco|.*DTS.Agent|Favorites.Sweeper|FEZhead|GetRight|go-ahead-got-it|.*Harvest|IBM_Planetwide|leech|MCspider|NetResearchServer|nost\.info|OpaL|PackRat|RepoMonkey|.*Rover|Spegla|SqWorm|.*TrueRobot|UtilMind|vspider|.*WUMPUS) [NC,OR]
# A host which tries to hide itself in reverse DNS lookup
RewriteCond %{REMOTE_HOST} ^private$ [NC,OR]
# Web surveying sites (may require using ipchains)
RewriteCond %{HTTP_REFERER} (traffixer|netfactual|netcraft)\.com [NC,OR]
RewriteCond %{REMOTE_HOST} \.netcraft\.com$ [NC,OR]
# A fake referrer that's often used -- use this unless your pages are related
# in some way to atomic energy and could really be linked to from www.iaea.org
RewriteCond %{HTTP_REFERER} ^[^?]*iaea\.org [NC,OR]
# A fake referrer that's used in conjuncting with formmail exploits
RewriteCond %{HTTP_REFERER} ^[^?]*\.ideography\.co\.uk [NC]
# The rule which blocks out further access from the host
RewriteRule .* - [F,L]
C'est sur ca n'arrete QUE les aspirateurs de sites qui ne triche pas sur leur USERS AGENTS. Mais pour l'instant ca marche plutot pas mal.
Normalement on doit pouvoir incorporé cela dans le .htaccess
A vérifié.
Autre chose, il y a aussi le module apache mod_throttle pour limiter la bande passante consommé par IP.
Car à vrai dire les seuls qui consomme de la bande passante anormalement ce sont les aspirateur de site.
Mais j'ai peur de bloquer google et les autres moteurs de recherche avec ca...... genre limité 15 Mb par IP par jour....
Bruno
Administrateur systeme de
http://www.hebergementx-gratuit.com
-

Kmacleod - WRInaute accro

- Messages: 3418
- Inscription: 28 Nov 2002
Il y a arreter et arreter
Au debut j'essayer d'arreter les aspis avec mon .htaccess
Celà n'empeche pas un aspis de faire 1.500 hits sur le serveur et c'est là ma problèmatique au delà de la BP
Le script de renad rouge est radical, je laisse rentre au niveau du .htaccess et si il y a exces de vitesse, dehors.
Et j'ai droit à un IP bannie par jour
Au debut j'essayer d'arreter les aspis avec mon .htaccess
Celà n'empeche pas un aspis de faire 1.500 hits sur le serveur et c'est là ma problèmatique au delà de la BP
Le script de renad rouge est radical, je laisse rentre au niveau du .htaccess et si il y a exces de vitesse, dehors.
Et j'ai droit à un IP bannie par jour
- charly99
- Nouveau WRInaute

- Messages: 3
- Inscription: 2 Avr 2003
Salut à tous,
J'ai moi aussi depuis peu qqs aspirateurs pas trés sympa qui parcourent les pages de mon site en y aspirant tout ce qui s'y trouve... Ca me bouffe pas mal de bande passante. C'est pourquoi je suis interessé par tes scripts pour bloquer ces aspirateurs de malheur...
J'ai moi aussi depuis peu qqs aspirateurs pas trés sympa qui parcourent les pages de mon site en y aspirant tout ce qui s'y trouve... Ca me bouffe pas mal de bande passante. C'est pourquoi je suis interessé par tes scripts pour bloquer ces aspirateurs de malheur...
- thewiseoldman
- Nouveau WRInaute

- Messages: 5
- Inscription: 11 Mai 2003
Je suis interessé par ce script car les .htacess avec rewritecond soit bloquent des visiteurs qu'ils ne devraient pas soit laissent passer des aspi camouflés
- Andy hubert
- Nouveau WRInaute

- Messages: 1
- Inscription: 18 Mai 2003
peux tu me l'envoyer, je suis interréssé pour ejecter les aspirateurs et les piqueurs d'adresses.
Merci
Andy
PS Au fait je sais pas comment tu récupére mon adresse ?
thk
Merci
Andy
PS Au fait je sais pas comment tu récupére mon adresse ?
thk
-

WebRankInfo - Administrateur du site

- Messages: 18964
- Inscription: 19 Avr 2002
L'adresse email est visible dans le profil de chaque mmebre du forumAndy hubert a écrit:PS Au fait je sais pas comment tu récupére mon adresse ?![]()
thk
-

Renardrouge - Nouveau WRInaute

- Messages: 47
- Inscription: 19 Nov 2002
Url du script en post 1 pour éviter les mp.
Merci de votre interêt dans cette lutte perpetuelle contre ces bêtes là.

Merci de votre interêt dans cette lutte perpetuelle contre ces bêtes là.
-

Renardrouge - Nouveau WRInaute

- Messages: 47
- Inscription: 19 Nov 2002
On me rapporte que Kapere serait passé au travers.
Quelqu'un aurait-il Kapere pour un test ? (sur l'url de mon site quand vous le souhaitez)
Quelqu'un aurait-il Kapere pour un test ? (sur l'url de mon site quand vous le souhaitez)
Lectures recommandées sur ce thème :
- Mon script anti-aspirateur a blacklisté googlebot.
- Script anti-aspirateur et Google (et les autres...)
- anti-aspirateur
- Anti aspirateur URGENT ?
- mod_rewrite et anti aspirateur
- /!\ aspirateur de site et anti référencement ...
- .htaccess anti-aspirateur de site
- [Résolu] Pb htaccess anti-aspirateur email
- Anti aspirateur: ne pas bloquer Google
- Anti aspirateur de site : une idée
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité

