.htaccess anti-aspirateur de site

Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics


nautiljon
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 254
Inscription: 23 Mar 2005

.htaccess anti-aspirateur de site

Message le Mar Mar 29, 2005 10:02

bonjour,
ça fait un moment que je galère a me faire un htaccess, au final j'arrive a rien, ça bloque rien du tout, je comprend pas pourquoi pourtant j'ai fait comme il est dit sur http://www.toulouse-renaissance.net/c_o ... erifie.htm
Le contenu de mon fichier : http://www.nautiljon.com/ahtaccess.txt
Si quelqu'un pouvais me donner le code qui fonctionne de son htaccess car là je desespère.
Merci.

Nautiljon.
Dernière édition par nautiljon le Mar Mar 29, 2005 13:33, édité 1 fois.


Ohax
WRInaute accro
WRInaute accro
 
Messages: 6406
Inscription: 5 Juil 2004

Message le Mar Mar 29, 2005 11:42



nautiljon
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 254
Inscription: 23 Mar 2005

Message le Mar Mar 29, 2005 11:58

J'ai copié tel quel le code que tu as fournis dans ton 1er post, j'ai mis le .htaccess à la racine de mon site web, je lance webcopier pour tester et il m'aspire mon site sans problème :S ? :@....


mamat-
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 373
Inscription: 18 Oct 2004

Message le Mar Mar 29, 2005 13:04

Certains aspirateur, je ne sais pas pour webcopier, lise et respecte le robots.txt, pour ce qui est du .htaccess il peut aussi suivant la progrmation trés facilement le respecter ou pas !


scores
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 496
Inscription: 24 Nov 2002

Message le Mar Mar 29, 2005 13:57

le problème avec toulouse-renaissance.net c'est que ces articles sont très anciens (+ 2-3 ans) si mes souvenirs sont bons,
alors bon nombres d'aspirateurs ont depuis longtemps contourné les astuces.

Ya que le liste htaccess des robots à bannir qui doit peut être être à jour.


nautiljon
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 254
Inscription: 23 Mar 2005

Message le Mar Mar 29, 2005 14:40

b'ah en faite déjà si j'arrive à faire fonctionner un script même si les infos sont pas à jour c'est pas grave !


nautiljon
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 254
Inscription: 23 Mar 2005

Message le Mar Mar 29, 2005 15:25

Apparament ça viendrai du serveur ? (OVH)
J'ai mis le strict minimum dans le htaccess à savoir :

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} WebCopier
RewriteRule .*$ http://www.sitefree.fr/403.php [R,L]

ça fonctionne bien, ça revoi sur la page 403 quand j'utilise Wepcopier mais apparament ça genère une erreur dans mes pages car le javascript de mon site ne fonctionne plus dès que j'utilise RewriteCond...

Je comprend pas :S, c'est vraiment très zarb, et le code de mes pages est valide xhtml !

Donc en attendant de trouver la solution, j'utilise la solution de bjp :
Code: Tout sélectionner
........
.......
SetEnvIfNoCase User-Agent "^Xenu's" bad_bot
SetEnvIfNoCase User-Agent "^Zeus" bad_bot
SetEnvIfNoCase User-Agent "^exabot.com" bad_bot
<Limit GET POST PUT HEAD>
order allow,deny
allow from all
deny from env=bad_bot
</Limit>

Je sais pas si c'est plus lourd ou quoi mais ça fonctionne, ça bloque bien.

bjp
WRInaute impliqué
WRInaute impliqué
 
Messages: 602
Inscription: 12 Mai 2003

Message le Mar Mar 29, 2005 16:57

Oh, c'est une soluce que j'avais pompé sur un forum US, mais elle marche bien.

Norbert_404
WRInaute discret
WRInaute discret
 
Messages: 81
Inscription: 10 Nov 2006

Message le Mer Jan 24, 2007 11:22

Bonjour, :D

C'est un peu HS mais mais en même temps je flag ;-)
Je développe mon site perso bilingue (Anglais + Fr) qui fait en tout 60/Mo de données et 56 pages.

Je me suis aperçu que la consommation cumulée du mois de Janvier s'éléve à ce jour à 1.06 Go ! 8O :smiley qui fait une crise cardiaque:
Sachant que j'ai de plus en plus de visiteurs sur mon site et ce, depuis des pays de plus en nombreux et exotiques, je crois que mon site a été aspiré...
Est-ce dû à ce fameux grand chambardement de google produit réccement ?
Un aspirateur ?
Vous en pensez quoi ?

Je mène l'enquête...


Bellegarde-webb
WRInaute passionné
WRInaute passionné
 
Messages: 1293
Inscription: 12 Juil 2006

Message le Mer Jan 24, 2007 12:45

nautiljon a écrit:Donc en attendant de trouver la solution, j'utilise la solution de bjp :
Code: Tout sélectionner
........
.......
SetEnvIfNoCase User-Agent "^Xenu's" bad_bot
SetEnvIfNoCase User-Agent "^Zeus" bad_bot
SetEnvIfNoCase User-Agent "^exabot.com" bad_bot
<Limit GET POST PUT HEAD>
order allow,deny
allow from all
deny from env=bad_bot
</Limit>

Je sais pas si c'est plus lourd ou quoi mais ça fonctionne, ça bloque bien.

Je ne suis pas chez OVH.
Je veux que tu précises car je ne comprend pas le code cité. Je peux ajouter tel quel le code
cité dans mon .htaccess et après ... et je n'aurai pas de problèmes?? :D :D
J'aimerai quand meme comprendre ce que fait le code en détail. :( :(


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par les experts Google Analytics de Ranking Metrics.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités