Liste d'IP et user agent d'indésirables ? (bot)
4 messages
• Page 1 sur 1
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
-

milkiway - WRInaute accro

- Messages: 4910
- Inscription: 3 Fév 2004
Liste d'IP et user agent d'indésirables ? (bot)
Bonjour,
Connaissez vous une liste des User Agent et ou adresses IP connues comme néfastes ou inutiles ?
Il y a des centaines et des centaines de bot de centaines de projets de moteurs, aspirateurs & co qui sortent chaque jours et qui crawlent nos sites (et consomment des ressources) sans raison valable.
Je souhaiterais les bloquer de mon trafic. Je parle d'interdiction apache et non un simple robots.txt.
Exemple à une époque, un bot nommé Slurp s'acharnait sur deux de mes URL mais le moteur ne m'apportait pas plus de deux ou trois visiteurs par mois.
Merci
Connaissez vous une liste des User Agent et ou adresses IP connues comme néfastes ou inutiles ?
Il y a des centaines et des centaines de bot de centaines de projets de moteurs, aspirateurs & co qui sortent chaque jours et qui crawlent nos sites (et consomment des ressources) sans raison valable.
Je souhaiterais les bloquer de mon trafic. Je parle d'interdiction apache et non un simple robots.txt.
Exemple à une époque, un bot nommé Slurp s'acharnait sur deux de mes URL mais le moteur ne m'apportait pas plus de deux ou trois visiteurs par mois.
Merci
-

Zecat - WRInaute accro

- Messages: 11997
- Inscription: 1 Mar 2005
Re: Liste d'IP et user agent d'indésirables ? (bot)
milkiway a écrit: Bonjour,
Connaissez vous une liste des User Agent et ou adresses IP connues comme néfastes ou inutiles ?
Il y a des centaines et des centaines de bot de centaines de projets de moteurs, aspirateurs & co qui sortent chaque jours et qui crawlent nos sites (et consomment des ressources) sans raison valable.
A mon avis, pour avoir un peu creusé la chose, l'approche Ip / user agent n'ets pas la bonne :
- les ip : avec les proxy c'est indémerdable
- les user agents : n'importe quel crawler permet de mettre n'importe quel user agent
Perso j'ai mis en place une succession de dispositifs avec comme logique :
- analyser un comportement (nb de pages vues sur des periodes définies plus ou moins longues),
- acceptation des cookies ou pas
- mise en place de pieges a bots (le prealable étant que tu aies mis en place un module fiable d'identification des bon bots que tu autorises pour ne pas leur présenter à eux les pieges à bots).
etc etc
Et ca aboutit a des ban automatiques (pas au niveau htaccess mais simplement ban soft qui redirige ensuite toute visite via header vers une page d'alerte ... et seulement si un bot insiste trop a butter sur la page d'alerte des centaines de fois, j'interviens manuellement pour le coller en deny dans htaccess.
milkiway a écrit:Exemple à une époque, un bot nommé Slurp s'acharnait sur deux de mes URL mais le moteur ne m'apportait pas plus de deux ou trois visiteurs par mois.
C'est yahoo ...
-

milkiway - WRInaute accro

- Messages: 4910
- Inscription: 3 Fév 2004
Re: Liste d'IP et user agent d'indésirables ? (bot)
Oui mais certains utilisent toujours le même UA. Ceux dont je suis sur, je voudrais pouvoir les bloquer. Ils ne sont pas faits pour énerver, c'est juste que je me fous de leur moteur.
-

Zecat - WRInaute accro

- Messages: 11997
- Inscription: 1 Mar 2005
Re: Liste d'IP et user agent d'indésirables ? (bot)
ben alors à toi de te faire TA liste parce que le notion de utiles / nefastes va varier selon le point de vue de chacun. Par exemple moi j'ai dcidé sur un site d'autoriser une quinzaine de gros bots et tous les autres : à la trappe. C'est mon choix pour ce site et je doute qu'il soit pertinent pour d'autres.
4 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par les experts Google Analytics de Ranking Metrics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
Consultez la description détaillée des produits ou services de Google suivants : Google Feed Fetcher
- Analyse du positionnement
AgentWebRanking est un logiciel professionnel qui permet d'analyser le positionnement d'un ou plusieurs sites dans plus de 300 moteurs de recherche dans le monde. Vous pouvez ainsi analyser les performances du référencement pour de nombreux mots-clés.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
