Psycheclone, robot ou aspirateur ?

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

cedriic
Nouveau WRInaute
 
Messages: 15
Inscription: Mer Nov 30, 2005 15:12

Psycheclone, robot ou aspirateur ?

Message le Ven Juin 09, 2006 19:19

Bonjour,

Cela fait deux fois ce mois de juin que mon script anti aspirateur m'informe qu'un certain psycheclone (ce nom est récupéré par http_user_agent dans mon script) tente de visiter mes pages à plus de 25 pages/minute.

Cette chose est venu le 02/06/2006 avec l'IP 208.66.195.3 puis le 09/06/2006 avec l'IP 208.66.195.10

Une recherche sur Google avec psycheclone ne donne que des pages de logs où l'on voit que ce truc possède visiblement la plage d'IP commençant par 208.66.195 et donc semble être un robot.

Un whois sur une des IP de la chose donne :

McColo Corporation MCCOLO (NET-208-66-192-0-1)
208.66.192.0 - 208.66.195.255
Digital Infinity Ltd DIGITALINFINITY (NET-208-66-195-0-1)
208.66.195.0 - 208.66.195.15

La première boîte existe (http://mccolo.com/english/index.html) et fait de la location de serveur mais la seconde n'a pas de site web bien qu'on retrouve la trace de cette société ici (si il s'agit bien de la même) : http://www.ukdata.com/numbers/05152250.html

Alors ami ou ennemi ?

@+


Boby Night
Nouveau WRInaute
 
Messages: 36
Inscription: Mar Avr 18, 2006 9:03

Message le Ven Juin 09, 2006 19:22

J'ai égement un robot a ma disposition (le bobybot :D )
Dans le cas d'un truc pas connu, c'est peut etre utilisé pour des besoins spécifiques. (pub, espionnage pub, ptet qu'il clique sur tes adsense ?)
Ou encore récupère-t-il des morceaux de code pour les utiliser a son compte de façon automatique...
Regardes surtout son comportement pour voir ce qu'il en est


Borower
WRInaute accro
WRInaute accro
 
Messages: 2151
Inscription: Lun Avr 18, 2005 20:58

Message le Ven Juin 09, 2006 20:12

Boby Night a écrit:J'ai égement un robot a ma disposition (le bobybot :D )
Dans le cas d'un truc pas connu, c'est peut etre utilisé pour des besoins spécifiques. (pub, espionnage pub, ptet qu'il clique sur tes adsense ?)
Ou encore récupère-t-il des morceaux de code pour les utiliser a son compte de façon automatique...
Regardes surtout son comportement pour voir ce qu'il en est


C'est tres interessant ce que tu viens de dire.
Quels sont les technologies utiliser pour créer un robots ou bots.
DSL pour ma questions qui peut paraitre stupide :roll:


ecocentric
WRInaute accro
WRInaute accro
 
Messages: 3577
Inscription: Mar Fév 10, 2004 16:40

Message le Ven Juin 09, 2006 20:21

Borower a écrit:
Boby Night a écrit:J'ai égement un robot a ma disposition (le bobybot :D )
Dans le cas d'un truc pas connu, c'est peut etre utilisé pour des besoins spécifiques. (pub, espionnage pub, ptet qu'il clique sur tes adsense ?)
Ou encore récupère-t-il des morceaux de code pour les utiliser a son compte de façon automatique...
Regardes surtout son comportement pour voir ce qu'il en est


C'est tres interessant ce que tu viens de dire.
Quels sont les technologies utiliser pour créer un robots ou bots.
DSL pour ma questions qui peut paraitre stupide :roll:


Un interpréteur Perl ou Python et c'est parti ;-) ! Ces deux langages incluent ce qu'il faut pour traiter des formulaires, ouvrir des URLs, analyser des chaines, etc.


Borower
WRInaute accro
WRInaute accro
 
Messages: 2151
Inscription: Lun Avr 18, 2005 20:58

Message le Ven Juin 09, 2006 20:27

Merci pour ta reponce ecocentric
Avec un windows on peut utiliser (lancer) des scripts Perl ou Python ou il faut utiliser un type de machine preci ? (Linux)


Serious
WRInaute accro
WRInaute accro
 
Messages: 2438
Inscription: Lun Nov 21, 2005 18:29

Message le Ven Juin 09, 2006 21:10

Avec un nom pareil, surement ennemi.
Au mieux, c'est du scraping avec markov derriere donc pas de dommage pour toi (a part la BP), au pire du mirroring.
Par ailleurs, tu utilises quoi comme antibot?
mon site ayant ete clone au moins trois fois...

cedriic
Nouveau WRInaute
 
Messages: 15
Inscription: Mer Nov 30, 2005 15:12

Message le Ven Juin 09, 2006 21:27

Hello,

J'ai trouvé un script simple et efficace ici : http://www.1001bd.com/stop_aspirateurs/

Je l'ai modifié pour pouvoir accepter les IP de confiance (celle des robots) car certains bots de google aspirent plus de 25 pages/minute qui est la limite que j'ai fixé pour bloquer une IP

Je ne me sers pas du USER_AGENT qui est falsifiable plus facilement qu'une IP (je ne me rapelle d'ailleurs pas si ce script l'utilisait au départ).

Pour la liste des IP de confiance : http://iplists.com/nw/

Voilà, en tous cas le mystère psycheclone reste entier 8O


ecocentric
WRInaute accro
WRInaute accro
 
Messages: 3577
Inscription: Mar Fév 10, 2004 16:40

Message le Ven Juin 09, 2006 21:28

Borower a écrit:Merci pour ta reponce ecocentric
Avec un windows on peut utiliser (lancer) des scripts Perl ou Python ou il faut utiliser un type de machine preci ? (Linux)


Je suis sous Windows, parfois sous Linux. Python fonctionne très bien sur les deux. Pour Perl, je ne l'ai utilisé que sur un serveur Linux, mais ça doit tourner sous Windows aussi. Dans les deux cas, il faut télécharger un interpréteur. J'ai choisi Python, pour des scripts de type robots, que je trouve plus simple d'utilisation (il y a moyen de faire du code impigeable sous Perl). Ceci étant, il y a des bibliothèque tout-à-fait impressionnantes sous Perl, par exemple pour faire des bots qui gèrent les formulaires.

thierry8
WRInaute accro
WRInaute accro
 
Messages: 3251
Inscription: Lun Juil 11, 2005 11:47

Message le Ven Juin 09, 2006 21:58

Ca peut également être un robot en C++, etc...
Tu peux faire dans tous les langages, même en php...

cedriic
Nouveau WRInaute
 
Messages: 15
Inscription: Mer Nov 30, 2005 15:12

Message le Dim Juin 11, 2006 10:34

Bonjour,

Le mystérieux psycheclone est revenu hier et aujourd'hui avec les IP 208.66.195.11 et 208.66.195.11

Il insiste...


Digit
WRInaute passionné
WRInaute passionné
 
Messages: 613
Inscription: Ven Avr 18, 2003 0:19

Message le Dim Juin 11, 2006 14:53

Je confirme, j'ai eu sa visite de plusieurs ip.
Comme il prend aussi robots.txt, je l'y ai inséré pour voir s'il le respecte.

karan
WRInaute discret
WRInaute discret
 
Messages: 54
Inscription: Lun Mai 03, 2004 15:16

Re: Psycheclone, robot ou aspirateur ?

Message le Ven Juin 16, 2006 23:54

cedriic a écrit:
Alors ami ou ennemi ?

@+

Probablement ennemi.
http://forums.digitalpoint.com/showthread.php?t=92965
.


Linkid
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 224
Inscription: Mar Mai 09, 2006 14:21

Message le Jeu Juin 22, 2006 19:55

Chez moi aussi, il est venu... Dès que j'ai vu qu'un nouveau robot est venu sur mon site, j'ai été surpris ! Et puis en plus il est Russe ...
Son IP : 208.66.195.4

Enfin, ce n'est que le deuxième russe...


Linkid
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 224
Inscription: Mar Mai 09, 2006 14:21

Message le Jeu Juin 22, 2006 19:57

Sinon, il y a aussi un certains -http://irl.cs.tamu.edu/crawler qui est venu sur mon site... (même question que pour psycheclone : ami ou ennemi ?)

mijsoot
Nouveau WRInaute
 
Messages: 45
Inscription: Mer Oct 12, 2005 12:06

Message le Jeu Juil 06, 2006 14:29

Je me suis fait visiter aussi au mois de juin, 1527 hits !!!!

J'ai trouver ça dans mes archives :

Code: Tout sélectionner
SetEnvIfNoCase User-Agent "psycheclone" bad_bot
SetEnvIfNoCase User-Agent "SurveyBot/2.3" bad_bot
SetEnvIfNoCase User-Agent "ia_archiver" bad_bot
SetEnvIfNoCase User-Agent "SBIder/0.8-dev" bad_bot
SetEnvIfNoCase User-Agent "aipbot/1.0" bad_bot
Deny from env=bad_bot

A mettre dans le .htaccess


Tant qu'à faire on en dégage d'autre en même temps. Par contre je viens de le mettre en place et je ne sais pas si cela fonctionne correctement.



A +

Psycheclone, robot ou aspirateur ?

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités