.htaccess anti-aspirateur de site

Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics


nautiljon
WRInaute impliqué
WRInaute impliqué
 
Messages: 254
Inscription: Mer Mar 23, 2005 17:51

.htaccess anti-aspirateur de site

Message le Mar Mar 29, 2005 10:02

bonjour,
ça fait un moment que je galère a me faire un htaccess, au final j'arrive a rien, ça bloque rien du tout, je comprend pas pourquoi pourtant j'ai fait comme il est dit sur http://www.toulouse-renaissance.net/c_o ... erifie.htm
Le contenu de mon fichier : http://www.nautiljon.com/ahtaccess.txt
Si quelqu'un pouvais me donner le code qui fonctionne de son htaccess car là je desespère.
Merci.

Nautiljon.
Dernière édition par nautiljon le Mar Mar 29, 2005 13:33, édité 1 fois.


Ohax
WRInaute accro
WRInaute accro
 
Messages: 6392
Inscription: Lun Juil 05, 2004 13:30

Message le Mar Mar 29, 2005 11:42



nautiljon
WRInaute impliqué
WRInaute impliqué
 
Messages: 254
Inscription: Mer Mar 23, 2005 17:51

Message le Mar Mar 29, 2005 11:58

J'ai copié tel quel le code que tu as fournis dans ton 1er post, j'ai mis le .htaccess à la racine de mon site web, je lance webcopier pour tester et il m'aspire mon site sans problème :S ? :@....


mamat-
WRInaute impliqué
WRInaute impliqué
 
Messages: 360
Inscription: Lun Oct 18, 2004 14:12

Message le Mar Mar 29, 2005 13:04

Certains aspirateur, je ne sais pas pour webcopier, lise et respecte le robots.txt, pour ce qui est du .htaccess il peut aussi suivant la progrmation trés facilement le respecter ou pas !


scores
WRInaute impliqué
WRInaute impliqué
 
Messages: 467
Inscription: Dim Nov 24, 2002 19:12

Message le Mar Mar 29, 2005 13:57

le problème avec toulouse-renaissance.net c'est que ces articles sont très anciens (+ 2-3 ans) si mes souvenirs sont bons,
alors bon nombres d'aspirateurs ont depuis longtemps contourné les astuces.

Ya que le liste htaccess des robots à bannir qui doit peut être être à jour.


nautiljon
WRInaute impliqué
WRInaute impliqué
 
Messages: 254
Inscription: Mer Mar 23, 2005 17:51

Message le Mar Mar 29, 2005 14:40

b'ah en faite déjà si j'arrive à faire fonctionner un script même si les infos sont pas à jour c'est pas grave !


nautiljon
WRInaute impliqué
WRInaute impliqué
 
Messages: 254
Inscription: Mer Mar 23, 2005 17:51

Message le Mar Mar 29, 2005 15:25

Apparament ça viendrai du serveur ? (OVH)
J'ai mis le strict minimum dans le htaccess à savoir :

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} WebCopier
RewriteRule .*$ http://www.sitefree.fr/403.php [R,L]

ça fonctionne bien, ça revoi sur la page 403 quand j'utilise Wepcopier mais apparament ça genère une erreur dans mes pages car le javascript de mon site ne fonctionne plus dès que j'utilise RewriteCond...

Je comprend pas :S, c'est vraiment très zarb, et le code de mes pages est valide xhtml !

Donc en attendant de trouver la solution, j'utilise la solution de bjp :
Code: Tout sélectionner
........
.......
SetEnvIfNoCase User-Agent "^Xenu's" bad_bot
SetEnvIfNoCase User-Agent "^Zeus" bad_bot
SetEnvIfNoCase User-Agent "^exabot.com" bad_bot
<Limit GET POST PUT HEAD>
order allow,deny
allow from all
deny from env=bad_bot
</Limit>

Je sais pas si c'est plus lourd ou quoi mais ça fonctionne, ça bloque bien.

bjp
WRInaute passionné
WRInaute passionné
 
Messages: 602
Inscription: Lun Mai 12, 2003 13:23

Message le Mar Mar 29, 2005 16:57

Oh, c'est une soluce que j'avais pompé sur un forum US, mais elle marche bien.

Norbert_404
WRInaute discret
WRInaute discret
 
Messages: 81
Inscription: Ven Nov 10, 2006 22:56

Message le Mer Jan 24, 2007 11:22

Bonjour, :D

C'est un peu HS mais mais en même temps je flag ;-)
Je développe mon site perso bilingue (Anglais + Fr) qui fait en tout 60/Mo de données et 56 pages.

Je me suis aperçu que la consommation cumulée du mois de Janvier s'éléve à ce jour à 1.06 Go ! 8O :smiley qui fait une crise cardiaque:
Sachant que j'ai de plus en plus de visiteurs sur mon site et ce, depuis des pays de plus en nombreux et exotiques, je crois que mon site a été aspiré...
Est-ce dû à ce fameux grand chambardement de google produit réccement ?
Un aspirateur ?
Vous en pensez quoi ?

Je mène l'enquête...


Bellegarde-webb
WRInaute accro
WRInaute accro
 
Messages: 1156
Inscription: Mer Juil 12, 2006 15:13

Message le Mer Jan 24, 2007 12:45

nautiljon a écrit:Donc en attendant de trouver la solution, j'utilise la solution de bjp :
Code: Tout sélectionner
........
.......
SetEnvIfNoCase User-Agent "^Xenu's" bad_bot
SetEnvIfNoCase User-Agent "^Zeus" bad_bot
SetEnvIfNoCase User-Agent "^exabot.com" bad_bot
<Limit GET POST PUT HEAD>
order allow,deny
allow from all
deny from env=bad_bot
</Limit>

Je sais pas si c'est plus lourd ou quoi mais ça fonctionne, ça bloque bien.

Je ne suis pas chez OVH.
Je veux que tu précises car je ne comprend pas le code cité. Je peux ajouter tel quel le code
cité dans mon .htaccess et après ... et je n'aurai pas de problèmes?? :D :D
J'aimerai quand meme comprendre ce que fait le code en détail. :( :(


Formation recommandée sur ce thème :

Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par Julien Coquet, expert certifié officiellement par Google Analytics.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités