Psycheclone, robot ou aspirateur ?
17 messages • Page 1 sur 2 • 1, 2
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Psycheclone, robot ou aspirateur ?
Bonjour,
Cela fait deux fois ce mois de juin que mon script anti aspirateur m'informe qu'un certain psycheclone (ce nom est récupéré par http_user_agent dans mon script) tente de visiter mes pages à plus de 25 pages/minute.
Cette chose est venu le 02/06/2006 avec l'IP 208.66.195.3 puis le 09/06/2006 avec l'IP 208.66.195.10
Une recherche sur Google avec psycheclone ne donne que des pages de logs où l'on voit que ce truc possède visiblement la plage d'IP commençant par 208.66.195 et donc semble être un robot.
Un whois sur une des IP de la chose donne :
McColo Corporation MCCOLO (NET-208-66-192-0-1)
208.66.192.0 - 208.66.195.255
Digital Infinity Ltd DIGITALINFINITY (NET-208-66-195-0-1)
208.66.195.0 - 208.66.195.15
La première boîte existe (http://mccolo.com/english/index.html) et fait de la location de serveur mais la seconde n'a pas de site web bien qu'on retrouve la trace de cette société ici (si il s'agit bien de la même) : http://www.ukdata.com/numbers/05152250.html
Alors ami ou ennemi ?
@+
Cela fait deux fois ce mois de juin que mon script anti aspirateur m'informe qu'un certain psycheclone (ce nom est récupéré par http_user_agent dans mon script) tente de visiter mes pages à plus de 25 pages/minute.
Cette chose est venu le 02/06/2006 avec l'IP 208.66.195.3 puis le 09/06/2006 avec l'IP 208.66.195.10
Une recherche sur Google avec psycheclone ne donne que des pages de logs où l'on voit que ce truc possède visiblement la plage d'IP commençant par 208.66.195 et donc semble être un robot.
Un whois sur une des IP de la chose donne :
McColo Corporation MCCOLO (NET-208-66-192-0-1)
208.66.192.0 - 208.66.195.255
Digital Infinity Ltd DIGITALINFINITY (NET-208-66-195-0-1)
208.66.195.0 - 208.66.195.15
La première boîte existe (http://mccolo.com/english/index.html) et fait de la location de serveur mais la seconde n'a pas de site web bien qu'on retrouve la trace de cette société ici (si il s'agit bien de la même) : http://www.ukdata.com/numbers/05152250.html
Alors ami ou ennemi ?
@+
-

Boby Night - Nouveau WRInaute
- Messages: 36
- Inscription: Mar Avr 18, 2006 9:03
J'ai égement un robot a ma disposition (le bobybot
)
Dans le cas d'un truc pas connu, c'est peut etre utilisé pour des besoins spécifiques. (pub, espionnage pub, ptet qu'il clique sur tes adsense ?)
Ou encore récupère-t-il des morceaux de code pour les utiliser a son compte de façon automatique...
Regardes surtout son comportement pour voir ce qu'il en est
Dans le cas d'un truc pas connu, c'est peut etre utilisé pour des besoins spécifiques. (pub, espionnage pub, ptet qu'il clique sur tes adsense ?)
Ou encore récupère-t-il des morceaux de code pour les utiliser a son compte de façon automatique...
Regardes surtout son comportement pour voir ce qu'il en est
Boby Night a écrit:J'ai égement un robot a ma disposition (le bobybot)
Dans le cas d'un truc pas connu, c'est peut etre utilisé pour des besoins spécifiques. (pub, espionnage pub, ptet qu'il clique sur tes adsense ?)
Ou encore récupère-t-il des morceaux de code pour les utiliser a son compte de façon automatique...
Regardes surtout son comportement pour voir ce qu'il en est
C'est tres interessant ce que tu viens de dire.
Quels sont les technologies utiliser pour créer un robots ou bots.
DSL pour ma questions qui peut paraitre stupide
-

ecocentric - WRInaute accro

- Messages: 3577
- Inscription: Mar Fév 10, 2004 16:40
Borower a écrit:Boby Night a écrit:J'ai égement un robot a ma disposition (le bobybot)
Dans le cas d'un truc pas connu, c'est peut etre utilisé pour des besoins spécifiques. (pub, espionnage pub, ptet qu'il clique sur tes adsense ?)
Ou encore récupère-t-il des morceaux de code pour les utiliser a son compte de façon automatique...
Regardes surtout son comportement pour voir ce qu'il en est
C'est tres interessant ce que tu viens de dire.
Quels sont les technologies utiliser pour créer un robots ou bots.
DSL pour ma questions qui peut paraitre stupide
Un interpréteur Perl ou Python et c'est parti
Avec un nom pareil, surement ennemi.
Au mieux, c'est du scraping avec markov derriere donc pas de dommage pour toi (a part la BP), au pire du mirroring.
Par ailleurs, tu utilises quoi comme antibot?
mon site ayant ete clone au moins trois fois...
Au mieux, c'est du scraping avec markov derriere donc pas de dommage pour toi (a part la BP), au pire du mirroring.
Par ailleurs, tu utilises quoi comme antibot?
mon site ayant ete clone au moins trois fois...
Hello,
J'ai trouvé un script simple et efficace ici : http://www.1001bd.com/stop_aspirateurs/
Je l'ai modifié pour pouvoir accepter les IP de confiance (celle des robots) car certains bots de google aspirent plus de 25 pages/minute qui est la limite que j'ai fixé pour bloquer une IP
Je ne me sers pas du USER_AGENT qui est falsifiable plus facilement qu'une IP (je ne me rapelle d'ailleurs pas si ce script l'utilisait au départ).
Pour la liste des IP de confiance : http://iplists.com/nw/
Voilà, en tous cas le mystère psycheclone reste entier
J'ai trouvé un script simple et efficace ici : http://www.1001bd.com/stop_aspirateurs/
Je l'ai modifié pour pouvoir accepter les IP de confiance (celle des robots) car certains bots de google aspirent plus de 25 pages/minute qui est la limite que j'ai fixé pour bloquer une IP
Je ne me sers pas du USER_AGENT qui est falsifiable plus facilement qu'une IP (je ne me rapelle d'ailleurs pas si ce script l'utilisait au départ).
Pour la liste des IP de confiance : http://iplists.com/nw/
Voilà, en tous cas le mystère psycheclone reste entier
-

ecocentric - WRInaute accro

- Messages: 3577
- Inscription: Mar Fév 10, 2004 16:40
Borower a écrit:Merci pour ta reponce ecocentric
Avec un windows on peut utiliser (lancer) des scripts Perl ou Python ou il faut utiliser un type de machine preci ? (Linux)
Je suis sous Windows, parfois sous Linux. Python fonctionne très bien sur les deux. Pour Perl, je ne l'ai utilisé que sur un serveur Linux, mais ça doit tourner sous Windows aussi. Dans les deux cas, il faut télécharger un interpréteur. J'ai choisi Python, pour des scripts de type robots, que je trouve plus simple d'utilisation (il y a moyen de faire du code impigeable sous Perl). Ceci étant, il y a des bibliothèque tout-à-fait impressionnantes sous Perl, par exemple pour faire des bots qui gèrent les formulaires.
Re: Psycheclone, robot ou aspirateur ?
cedriic a écrit:
Alors ami ou ennemi ?
@+
Probablement ennemi.
http://forums.digitalpoint.com/showthread.php?t=92965
.
Je me suis fait visiter aussi au mois de juin, 1527 hits !!!!
J'ai trouver ça dans mes archives :
A mettre dans le .htaccess
Tant qu'à faire on en dégage d'autre en même temps. Par contre je viens de le mettre en place et je ne sais pas si cela fonctionne correctement.
A +
J'ai trouver ça dans mes archives :
- Code: Tout sélectionner
SetEnvIfNoCase User-Agent "psycheclone" bad_bot
SetEnvIfNoCase User-Agent "SurveyBot/2.3" bad_bot
SetEnvIfNoCase User-Agent "ia_archiver" bad_bot
SetEnvIfNoCase User-Agent "SBIder/0.8-dev" bad_bot
SetEnvIfNoCase User-Agent "aipbot/1.0" bad_bot
Deny from env=bad_bot
A mettre dans le .htaccess
Tant qu'à faire on en dégage d'autre en même temps. Par contre je viens de le mettre en place et je ne sais pas si cela fonctionne correctement.
A +
17 messages • Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Petit changement pour Slurp (le robot de Yahoo)
- Sortie officielle de GoogleStats v2.0 !
- Sortie de GoogleStats v2.01
- Etude de Googlebot, le robot d'indexation de Google
- Référencement : le problème des sessions des pages PHP
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- Googlebot, le robot d'indexation de Google
- Robots.txt : Yahoo supporte les options avancées
- Votre site doit toujours être accessible rapidement : conseil n°7 en référencement
- Présentation de l'indexation Google - Googlebot, le robot de Google
- Aspirateur ?
- Aspirateur d email
- Aspirateur de site ?
- Aspirateur de site
- anti-aspirateur
- [réglé] Help : Aspirateur ténace
- flash : le grand aspirateur de pagerank
- Aspirateur + tueur de site
- /!\ aspirateur de site et anti référencement ...
- cherche aspirateur de site
- Comment fonctionne un aspirateur de site ?
- Anti aspirateur URGENT ?
- .htaccess anti-aspirateur de site
- mod_rewrite et anti aspirateur
- Script php Anti aspirateur.
Consultez la description détaillée des produits ou services de Google suivants : Google Feed Fetcher, Googlebot
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités






le forum