QuepasaCreep : un robot bugué ?

Olivier Duffez (admin)
Membre du personnel
QuepasaCreep génère tout un tas d'erreurs 404 en venant indexer des pages dont l'URL est tronquée : il manque le 'm' de 'htm'.
Exemple parmi tant d'autres :
Code:
forums/viewpost_9093.ht
Je vais finir par l'interdire...
Le voyez-vous sur vos sites ?
 
Nouveau WRInaute
Bonjour,

Oui il a fait plusieurs apparitions cette semaine et la semaine dernière. Nous allons également le bannir : il n'est pas très poli en pompant bien comme il faut, et il génère les erreurs que tu évoques.

De plus, personne ne sait précisément à quoi il va vraiment servir.
 
WRInaute impliqué
Oui, nous sommes victimes aussi :
3 IP différentes
QuepasaCreep v0.9.13 69.28.130.229 2003/05/27 05:01 69.28.130.229
QuepasaCreep v0.9.13 69.28.130.230 2003/05/27 02:58 69.28.130.230
QuepasaCreep v0.9.13 69.28.130.231 2003/04/29 21:12 69.28.130.231

Pas d'erreurs 404... il doit préférer les pages avec extension .php... Par contre il crawle de manière anarchique...

QuepasaCreep est un nouvel avatar du moteur de recherche de Quepasa.com, le site leader aux USA pour les hispaniques. Le moteur avait été abandonné, mais visiblement,ils ont relancé l'idée récemment.

Il semble que cela soit une suite du rachat du moteur vayala.com par QuePasa. Une acquisition mal digérée ?

Le truc bizarre, c'est que nos sites ne sont pas en español ? Que pasa, hombre ?
 
WRInaute occasionnel
WebRankInfo a dit:
QuepasaCreep génère tout un tas d'erreurs 404 en venant indexer des pages dont l'URL est tronquée : il manque le 'm' de 'htm'.
Exemple parmi tant d'autres :
Code:
forums/viewpost_9093.ht
Je vais finir par l'interdire...
Le voyez-vous sur vos sites ?

Ca me rappelle Scooter qui avait fait la même chose sur mon site il n'y a pas très longtemps...
Je viens de voir QuePasaCreep dans mes logs : il est passé hier matin et n'a demandé que le fichier robots.txt et la page d'accueil.
Pas d'erreur dans les requêtes :lol:

Jocelyn
 
WRInaute passionné
Voila Quepasa sur mon site, il vient d'indexer deux pages
Je ne sais pas d'où il arrive ni ce qu'il vient voir, je ne parle pas espagnol.

Y a t'il des retours interessants avec ce moteur ou faut il l'arreter ?

kmacleod
 
WRInaute passionné
C'est vrai qu'il a un comportement plus que bizarre ce robot, 6 lecture de default.asp + 4 de robots.txt en 1/4h, c'est étrange...
 
WRInaute impliqué
Pas vraiment étrange, en ce qui me concerne.
Il est passé dans la journée du 17, m'a lu presque tout le site.

A part le fait qu'il relise robots.txt tous les 3 fichiers, il me paraît très bien élevé ce garçon.
Je ne pense pas qu'il y ait lieu de le bloquer.
 
Olivier Duffez (admin)
Membre du personnel
il vient de me générer plus de 700 erreurs 404 en quelques heures...
il vient voir des pages en oubliant les répertoires (il cherche tout à la racine) ou alors même des pages qui n'ont jamais existé sur mon site...

ce qui est bizarre c'est que même avec ça dans mon .htaccess :
Code:
RewriteCond %{REMOTE_ADDR} ^63\.148\.99\.233$ [OR]
RewriteCond %{REMOTE_ADDR} ^81\.56\.23\.23$ [OR]
RewriteCond %{REMOTE_ADDR} ^69\.28\.130\.230$ [OR]
RewriteCond %{REMOTE_ADDR} ^213\.244\.29\.170$
RewriteRule .* - [F,L]
il passe quand même avec l'adresse 69.28.130.230. J'ai mal écrit ma condition RewriteCond ?
 
WRInaute impliqué
C'est vrai que je retire ce que j'ai dit à son sujet : il n'arrête pas de générer des erreurs depuis 3 mois, il oublie les répertoires, il éclate les url et se met à chercher /& par exemple ou encore /mailto:...

Pour le bloquer, tu peux peut-être utiliser 'deny' qui est toujours plus rapide à exécuter que le rewriting.
Par contre, c'est vrai que ta condition devrait marcher.
 
WRInaute accro
Pero qué pasa ? :roll: quepasa pasa sobre mi sitio y de manera intensiva esos últimos días... debe ser porque hablamos el mismo idioma :lol:

Bon... trêve de plaisanterie... il passe beaucoup chez moi... on dirait qu'il a la fringale... mais pas autant que msnbot qui semble vouloir avaler tout ce qu'il trouve 8O
 
Discussions similaires
Haut