Méthode anti aspi ?
10 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Méthode anti aspi ?
Hello World,
j'ai vue plusieurs méthodes anti aspirateur de site et pour le .htaccess j'ai retenu ceci :
Je me demandais si mon htaccess est correct ? et si c'est pas mieux de faire comme ceci par exemple :
Je me suis également fais un script de blocage d'IP, si vous avez testé d'autres méthodes (également contre les bots à spam) elles sont les bienvenues
j'ai vue plusieurs méthodes anti aspirateur de site et pour le .htaccess j'ai retenu ceci :
- Code: Tout sélectionner
RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^-?$ [OR]
RewriteCond %{HTTP_USER_AGENT} Advanced\ Email\ Extractor [OR]
RewriteCond %{HTTP_USER_AGENT} almaden [NC,OR]
RewriteCond %{HTTP_USER_AGENT} @nonymouse [OR]
RewriteCond %{HTTP_USER_AGENT} Art-Online [OR]
RewriteCond %{HTTP_USER_AGENT} CherryPicker [OR]
RewriteCond %{HTTP_USER_AGENT} Crescent\ Internet\ ToolPack [OR]
RewriteCond %{HTTP_USER_AGENT} DirectUpdate [OR]
RewriteCond %{HTTP_USER_AGENT} Download\ Accelerator [OR]
RewriteCond %{HTTP_USER_AGENT} eCatch [OR]
RewriteCond %{HTTP_USER_AGENT} echo\ extense [OR]
RewriteCond %{HTTP_USER_AGENT} EmailCollector [OR]
RewriteCond %{HTTP_USER_AGENT} EmailWolf [OR]
RewriteCond %{HTTP_USER_AGENT} ExtractorPro [OR]
RewriteCond %{HTTP_USER_AGENT} Fetch\ API\ Request [OR]
RewriteCond %{HTTP_USER_AGENT} flashget [NC,OR]
RewriteCond %{HTTP_USER_AGENT} frontpage [NC,OR]
RewriteCond %{HTTP_USER_AGENT} Go!Zilla [OR]
RewriteCond %{HTTP_USER_AGENT} HTTP\ agent [OR]
RewriteCond %{HTTP_USER_AGENT} HTTPConnect [OR]
RewriteCond %{HTTP_USER_AGENT} HTTrack [OR]
RewriteCond %{HTTP_USER_AGENT} Indy\ Library [OR]
RewriteCond %{HTTP_USER_AGENT} IPiumBot\ laurion(dot)com [OR]
RewriteCond %{HTTP_USER_AGENT} Kapere [OR]
RewriteCond %{HTTP_USER_AGENT} libwww-perl [OR]
RewriteCond %{HTTP_USER_AGENT} Microsoft\ URL\ Control [OR]
RewriteCond %{HTTP_USER_AGENT} minibot\(NaverRobot\) [OR]
RewriteCond %{HTTP_USER_AGENT} NICErsPRO [OR]
RewriteCond %{HTTP_USER_AGENT} NPBot [OR]
RewriteCond %{HTTP_USER_AGENT} Offline\ Explorer [OR]
RewriteCond %{HTTP_USER_AGENT} Offline\ Navigator [OR]
RewriteCond %{HTTP_USER_AGENT} Program\ Shareware [OR]
RewriteCond %{HTTP_USER_AGENT} QuepasaCreep [OR]
RewriteCond %{HTTP_USER_AGENT} SiteMapper [OR]
RewriteCond %{HTTP_USER_AGENT} Star\ Downloader [OR]
RewriteCond %{HTTP_USER_AGENT} SurveyBot [OR]
RewriteCond %{HTTP_USER_AGENT} Teleport\ Pro [OR]
RewriteCond %{HTTP_USER_AGENT} Telesoft [OR]
RewriteCond %{HTTP_USER_AGENT} TuringOS [OR]
RewriteCond %{HTTP_USER_AGENT} TurnitinBot [OR]
RewriteCond %{HTTP_USER_AGENT} vobsub [NC,OR]
RewriteCond %{HTTP_USER_AGENT} webbandit [NC,OR]
RewriteCond %{HTTP_USER_AGENT} WebCapture [OR]
RewriteCond %{HTTP_USER_AGENT} webcollage [OR]
RewriteCond %{HTTP_USER_AGENT} WebCopier [OR]
RewriteCond %{HTTP_USER_AGENT} WebDAV [OR]
RewriteCond %{HTTP_USER_AGENT} WebEmailExtractor [OR]
RewriteCond %{HTTP_USER_AGENT} WebReaper [OR]
RewriteCond %{HTTP_USER_AGENT} WEBsaver [OR]
RewriteCond %{HTTP_USER_AGENT} WebStripper [OR]
RewriteCond %{HTTP_USER_AGENT} WebZIP [OR]
RewriteCond %{HTTP_USER_AGENT} Wget [NC,OR]
RewriteCond %{HTTP_USER_AGENT} Wysigot [NC,OR]
RewriteCond %{HTTP_USER_AGENT} Zeus.*Webster [OR]
RewriteCond %{HTTP_USER_AGENT} Zeus [OR]
#
# Un hôte qui tente de se cacher dans une reverse DNS lookup
RewriteCond %{REMOTE_HOST} ^private$ [NC,OR]
#
# Sites de surveillance du Web (peut nécessiter ipchains)
RewriteCond %{HTTP_USER_AGENT} traffixer [NC,OR]
RewriteCond %{HTTP_USER_AGENT} netfactual [NC,OR]
RewriteCond %{HTTP_USER_AGENT} netcraft [NC,OR]
#
# Un faux referrer souvent utilisé
RewriteCond %{HTTP_USER_AGENT} ^[^?]*iaea\.org [NC,OR]
#
# Le referrer "addresses.com" est utilisé par un email address extractor
RewriteCond %{HTTP_USER_AGENT} ^[^?]*addresses\.com [NC,OR]
#
# Bloque les navigateurs se dissimulants avec des lettres et chiffres aléatoires
RewriteCond %{HTTP_USER_AGENT} [0-9A-Za-z]{15,} [OR]
RewriteCond %{HTTP_USER_AGENT} ^[0-9A-Za-z]+$ [OR]
#
# Un faux referrer utilisé en conjonction avec un formmail exploits
RewriteCond %{HTTP_USER_AGENT} ^[^?]*\.ideography\.co\.uk [NC]
RewriteRule .*$ http://www.autre_site.com [R,L]
# Une redirection interne compte pour 2 hits
# Une redirection externe compte pour 1 hit
Je me demandais si mon htaccess est correct ? et si c'est pas mieux de faire comme ceci par exemple :
- Code: Tout sélectionner
RewriteCond %{HTTP_USER_AGENT} .*HTTrack [OR]
- Code: Tout sélectionner
RewriteCond %{HTTP_USER_AGENT} HTTrack [OR]
Je me suis également fais un script de blocage d'IP, si vous avez testé d'autres méthodes (également contre les bots à spam) elles sont les bienvenues
-

bproductiv - WRInaute accro

- Messages: 2807
- Inscription: Lun Déc 27, 2004 16:29
et ca te sert a quoi? j'ai jamais été convaincu de ce genre de méthode... 
-

bproductiv - WRInaute accro

- Messages: 2807
- Inscription: Lun Déc 27, 2004 16:29
donc si tu prend ces mesures c'est que tu a constaté régulièrement que des gens aspiraient ton site, et donc te plombent ta bande passante, non?
sinon aucun intérêt tout court, ta méthode, (peu importe laquelle) pourra tjs être détournée.
sinon aucun intérêt tout court, ta méthode, (peu importe laquelle) pourra tjs être détournée.
donc si tu prend ces mesures c'est que tu a constaté régulièrement que des gens aspiraient ton site, et donc te plombent ta bande passante, non?
Exactement
J'ai mis un simple blocage par IP et ça me bloque environ 2 aspirateurs ou bots par jour, lorque je cherche d'où proviennent ces IP je constate que se sont des serveurs de spam ou autre chose de pas très catholique.
Donc bien sûr c'est contournable mais ça a le mérite d'en bloquer certains, si à ça je peux coupler avec d'autres méthodes je ne vais pas cracher dessus malgré les conseils inverses des 2 compères ci-dessus
Alors personne ne connait d'autres méthodes ou pourrait me répondre concernant le .htaccess que j'ai posté svp ?
-

bproductiv - WRInaute accro

- Messages: 2807
- Inscription: Lun Déc 27, 2004 16:29
est ce que les humains arrivent encore à avoir accès à ton site tellement il est blindé?
-

bproductiv - WRInaute accro

- Messages: 2807
- Inscription: Lun Déc 27, 2004 16:29
ce que je veux dire et j'arrete là je te promet, c'est que ton htaccess suffit, ca ne sert a rien de rajouter d'autres méthodes.
Il n'enlève que le gros, il en reste certains qui passent au travers et le bloquage par IP fais une protection de plus qui marche un minimum vue que j'en ai bloqué quelques une.
Pour l'instant je vais me contenter de ça, si quelqu'un a a un conseil pour améliorer le .htaccess ou une méthode à soumettre elle est la bienvenue.
Pour l'instant je vais me contenter de ça, si quelqu'un a a un conseil pour améliorer le .htaccess ou une méthode à soumettre elle est la bienvenue.
10 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- La valse des rachats de sociétés par Google en mai/juin 2007
- Google Pack s'enrichit de 2 nouveaux logiciels gratuits
- Méthode LSI (Latent Semantic Indexing) et référencement
- Firefox et son projet de mesure de trafic des sites web
- Archive.org n'indexe plus rien depuis le 22 août 2008 ?
- Comment lutter contre les mauvaises redirections 302 (temporaires)
- Participez au projet 3x3 !
- Référencement Flash : guide pratique des méthodes
- Référencer un site en Flash : guide pratique des bonnes méthodes
- API Blogger : Google Data API
Consultez la description détaillée des produits ou services de Google suivants : Google TrustRank
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités



le forum