QuepasaCreep : un robot bugué ?

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 19420
Inscription: 19 Avr 2002

QuepasaCreep : un robot bugué ?

Message le Jeu Mai 29, 2003 11:56

QuepasaCreep génère tout un tas d'erreurs 404 en venant indexer des pages dont l'URL est tronquée : il manque le 'm' de 'htm'.
Exemple parmi tant d'autres :
Code: Tout sélectionner
forums/viewpost_9093.ht

Je vais finir par l'interdire...
Le voyez-vous sur vos sites ?

Nitou
WRInaute impliqué
WRInaute impliqué
 
Messages: 929
Inscription: 1 Déc 2002

Message le Jeu Mai 29, 2003 12:00

Non et tant mieux :P

Gautier_Girard
WRInaute discret
WRInaute discret
 
Messages: 55
Inscription: 24 Mai 2003

Message le Jeu Mai 29, 2003 19:13

Bonjour,

Oui il a fait plusieurs apparitions cette semaine et la semaine dernière. Nous allons également le bannir : il n'est pas très poli en pompant bien comme il faut, et il génère les erreurs que tu évoques.

De plus, personne ne sait précisément à quoi il va vraiment servir.


cariboo
WRInaute impliqué
WRInaute impliqué
 
Messages: 770
Inscription: 8 Fév 2003

Message le Jeu Mai 29, 2003 19:59

Oui, nous sommes victimes aussi :
3 IP différentes
QuepasaCreep v0.9.13 69.28.130.229 2003/05/27 05:01 69.28.130.229
QuepasaCreep v0.9.13 69.28.130.230 2003/05/27 02:58 69.28.130.230
QuepasaCreep v0.9.13 69.28.130.231 2003/04/29 21:12 69.28.130.231

Pas d'erreurs 404... il doit préférer les pages avec extension .php... Par contre il crawle de manière anarchique...

QuepasaCreep est un nouvel avatar du moteur de recherche de Quepasa.com, le site leader aux USA pour les hispaniques. Le moteur avait été abandonné, mais visiblement,ils ont relancé l'idée récemment.

Il semble que cela soit une suite du rachat du moteur vayala.com par QuePasa. Une acquisition mal digérée ?

Le truc bizarre, c'est que nos sites ne sont pas en español ? Que pasa, hombre ?

Jocelyn
WRInaute impliqué
WRInaute impliqué
 
Messages: 564
Inscription: 6 Nov 2002

Re: QuepasaCreep : un robot bugué ?

Message le Ven Mai 30, 2003 8:43

WebRankInfo a écrit:QuepasaCreep génère tout un tas d'erreurs 404 en venant indexer des pages dont l'URL est tronquée : il manque le 'm' de 'htm'.
Exemple parmi tant d'autres :
Code: Tout sélectionner
forums/viewpost_9093.ht

Je vais finir par l'interdire...
Le voyez-vous sur vos sites ?


Ca me rappelle Scooter qui avait fait la même chose sur mon site il n'y a pas très longtemps...
Je viens de voir QuePasaCreep dans mes logs : il est passé hier matin et n'a demandé que le fichier robots.txt et la page d'accueil.
Pas d'erreur dans les requêtes :lol:

Jocelyn


Kmacleod
WRInaute accro
WRInaute accro
 
Messages: 3418
Inscription: 28 Nov 2002

Message le Mer Déc 17, 2003 9:50

Voila Quepasa sur mon site, il vient d'indexer deux pages
Je ne sais pas d'où il arrive ni ce qu'il vient voir, je ne parle pas espagnol.

Y a t'il des retours interessants avec ce moteur ou faut il l'arreter ?

kmacleod


BadProcESs
WRInaute accro
WRInaute accro
 
Messages: 2657
Inscription: 28 Juil 2003

Message le Mer Déc 17, 2003 10:14

C'est vrai qu'il a un comportement plus que bizarre ce robot, 6 lecture de default.asp + 4 de robots.txt en 1/4h, c'est étrange...


Remi L.
WRInaute passionné
WRInaute passionné
 
Messages: 1063
Inscription: 6 Sep 2003

Message le Ven Déc 19, 2003 3:24

Pas vraiment étrange, en ce qui me concerne.
Il est passé dans la journée du 17, m'a lu presque tout le site.

A part le fait qu'il relise robots.txt tous les 3 fichiers, il me paraît très bien élevé ce garçon.
Je ne pense pas qu'il y ait lieu de le bloquer.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 19420
Inscription: 19 Avr 2002

Message le Lun Mar 15, 2004 8:04

il vient de me générer plus de 700 erreurs 404 en quelques heures...
il vient voir des pages en oubliant les répertoires (il cherche tout à la racine) ou alors même des pages qui n'ont jamais existé sur mon site...

ce qui est bizarre c'est que même avec ça dans mon .htaccess :
Code: Tout sélectionner
RewriteCond %{REMOTE_ADDR} ^63\.148\.99\.233$ [OR]
RewriteCond %{REMOTE_ADDR} ^81\.56\.23\.23$ [OR]
RewriteCond %{REMOTE_ADDR} ^69\.28\.130\.230$ [OR]
RewriteCond %{REMOTE_ADDR} ^213\.244\.29\.170$
RewriteRule .* - [F,L]
il passe quand même avec l'adresse 69.28.130.230. J'ai mal écrit ma condition RewriteCond ?


Remi L.
WRInaute passionné
WRInaute passionné
 
Messages: 1063
Inscription: 6 Sep 2003

Message le Lun Mar 15, 2004 11:11

C'est vrai que je retire ce que j'ai dit à son sujet : il n'arrête pas de générer des erreurs depuis 3 mois, il oublie les répertoires, il éclate les url et se met à chercher /& par exemple ou encore /mailto:...

Pour le bloquer, tu peux peut-être utiliser 'deny' qui est toujours plus rapide à exécuter que le rewriting.
Par contre, c'est vrai que ta condition devrait marcher.


Americas
WRInaute accro
WRInaute accro
 
Messages: 3380
Inscription: 24 Sep 2003

Message le Lun Mar 15, 2004 12:48

Pero qué pasa ? :roll: quepasa pasa sobre mi sitio y de manera intensiva esos últimos días... debe ser porque hablamos el mismo idioma :lol:

Bon... trêve de plaisanterie... il passe beaucoup chez moi... on dirait qu'il a la fringale... mais pas autant que msnbot qui semble vouloir avaler tout ce qu'il trouve 8O


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités