QuepasaCreep : un robot bugué ?
11 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

WebRankInfo - Administrateur du site

- Messages: 19420
- Inscription: 19 Avr 2002
QuepasaCreep : un robot bugué ?
QuepasaCreep génère tout un tas d'erreurs 404 en venant indexer des pages dont l'URL est tronquée : il manque le 'm' de 'htm'.
Exemple parmi tant d'autres :
Je vais finir par l'interdire...
Le voyez-vous sur vos sites ?
Exemple parmi tant d'autres :
- Code: Tout sélectionner
forums/viewpost_9093.ht
Je vais finir par l'interdire...
Le voyez-vous sur vos sites ?
- Gautier_Girard
- WRInaute discret

- Messages: 55
- Inscription: 24 Mai 2003
Bonjour,
Oui il a fait plusieurs apparitions cette semaine et la semaine dernière. Nous allons également le bannir : il n'est pas très poli en pompant bien comme il faut, et il génère les erreurs que tu évoques.
De plus, personne ne sait précisément à quoi il va vraiment servir.
Oui il a fait plusieurs apparitions cette semaine et la semaine dernière. Nous allons également le bannir : il n'est pas très poli en pompant bien comme il faut, et il génère les erreurs que tu évoques.
De plus, personne ne sait précisément à quoi il va vraiment servir.
-

cariboo - WRInaute impliqué

- Messages: 770
- Inscription: 8 Fév 2003
Oui, nous sommes victimes aussi :
3 IP différentes
QuepasaCreep v0.9.13 69.28.130.229 2003/05/27 05:01 69.28.130.229
QuepasaCreep v0.9.13 69.28.130.230 2003/05/27 02:58 69.28.130.230
QuepasaCreep v0.9.13 69.28.130.231 2003/04/29 21:12 69.28.130.231
Pas d'erreurs 404... il doit préférer les pages avec extension .php... Par contre il crawle de manière anarchique...
QuepasaCreep est un nouvel avatar du moteur de recherche de Quepasa.com, le site leader aux USA pour les hispaniques. Le moteur avait été abandonné, mais visiblement,ils ont relancé l'idée récemment.
Il semble que cela soit une suite du rachat du moteur vayala.com par QuePasa. Une acquisition mal digérée ?
Le truc bizarre, c'est que nos sites ne sont pas en español ? Que pasa, hombre ?
3 IP différentes
QuepasaCreep v0.9.13 69.28.130.229 2003/05/27 05:01 69.28.130.229
QuepasaCreep v0.9.13 69.28.130.230 2003/05/27 02:58 69.28.130.230
QuepasaCreep v0.9.13 69.28.130.231 2003/04/29 21:12 69.28.130.231
Pas d'erreurs 404... il doit préférer les pages avec extension .php... Par contre il crawle de manière anarchique...
QuepasaCreep est un nouvel avatar du moteur de recherche de Quepasa.com, le site leader aux USA pour les hispaniques. Le moteur avait été abandonné, mais visiblement,ils ont relancé l'idée récemment.
Il semble que cela soit une suite du rachat du moteur vayala.com par QuePasa. Une acquisition mal digérée ?
Le truc bizarre, c'est que nos sites ne sont pas en español ? Que pasa, hombre ?
- Jocelyn
- WRInaute impliqué

- Messages: 564
- Inscription: 6 Nov 2002
Re: QuepasaCreep : un robot bugué ?
WebRankInfo a écrit:QuepasaCreep génère tout un tas d'erreurs 404 en venant indexer des pages dont l'URL est tronquée : il manque le 'm' de 'htm'.
Exemple parmi tant d'autres :
- Code: Tout sélectionner
forums/viewpost_9093.ht
Je vais finir par l'interdire...
Le voyez-vous sur vos sites ?
Ca me rappelle Scooter qui avait fait la même chose sur mon site il n'y a pas très longtemps...
Je viens de voir QuePasaCreep dans mes logs : il est passé hier matin et n'a demandé que le fichier robots.txt et la page d'accueil.
Pas d'erreur dans les requêtes
Jocelyn
-

BadProcESs - WRInaute accro

- Messages: 2657
- Inscription: 28 Juil 2003
C'est vrai qu'il a un comportement plus que bizarre ce robot, 6 lecture de default.asp + 4 de robots.txt en 1/4h, c'est étrange...
-

Remi L. - WRInaute passionné

- Messages: 1063
- Inscription: 6 Sep 2003
Pas vraiment étrange, en ce qui me concerne.
Il est passé dans la journée du 17, m'a lu presque tout le site.
A part le fait qu'il relise robots.txt tous les 3 fichiers, il me paraît très bien élevé ce garçon.
Je ne pense pas qu'il y ait lieu de le bloquer.
Il est passé dans la journée du 17, m'a lu presque tout le site.
A part le fait qu'il relise robots.txt tous les 3 fichiers, il me paraît très bien élevé ce garçon.
Je ne pense pas qu'il y ait lieu de le bloquer.
-

WebRankInfo - Administrateur du site

- Messages: 19420
- Inscription: 19 Avr 2002
il vient de me générer plus de 700 erreurs 404 en quelques heures...
il vient voir des pages en oubliant les répertoires (il cherche tout à la racine) ou alors même des pages qui n'ont jamais existé sur mon site...
ce qui est bizarre c'est que même avec ça dans mon .htaccess :
il vient voir des pages en oubliant les répertoires (il cherche tout à la racine) ou alors même des pages qui n'ont jamais existé sur mon site...
ce qui est bizarre c'est que même avec ça dans mon .htaccess :
- Code: Tout sélectionner
RewriteCond %{REMOTE_ADDR} ^63\.148\.99\.233$ [OR]
RewriteCond %{REMOTE_ADDR} ^81\.56\.23\.23$ [OR]
RewriteCond %{REMOTE_ADDR} ^69\.28\.130\.230$ [OR]
RewriteCond %{REMOTE_ADDR} ^213\.244\.29\.170$
RewriteRule .* - [F,L]
-

Remi L. - WRInaute passionné

- Messages: 1063
- Inscription: 6 Sep 2003
C'est vrai que je retire ce que j'ai dit à son sujet : il n'arrête pas de générer des erreurs depuis 3 mois, il oublie les répertoires, il éclate les url et se met à chercher /& par exemple ou encore /mailto:...
Pour le bloquer, tu peux peut-être utiliser 'deny' qui est toujours plus rapide à exécuter que le rewriting.
Par contre, c'est vrai que ta condition devrait marcher.
Pour le bloquer, tu peux peut-être utiliser 'deny' qui est toujours plus rapide à exécuter que le rewriting.
Par contre, c'est vrai que ta condition devrait marcher.
-

Americas - WRInaute accro

- Messages: 3380
- Inscription: 24 Sep 2003
Pero qué pasa ?
quepasa pasa sobre mi sitio y de manera intensiva esos últimos días... debe ser porque hablamos el mismo idioma
Bon... trêve de plaisanterie... il passe beaucoup chez moi... on dirait qu'il a la fringale... mais pas autant que msnbot qui semble vouloir avaler tout ce qu'il trouve
Bon... trêve de plaisanterie... il passe beaucoup chez moi... on dirait qu'il a la fringale... mais pas autant que msnbot qui semble vouloir avaler tout ce qu'il trouve
11 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Petit changement pour Slurp (le robot de Yahoo) - 29-03-2007
- Sortie officielle de GoogleStats v2.0 ! - 23-02-2003
- Sortie de GoogleStats v2.01 - 02-03-2003
- Etude de Googlebot, le robot d'indexation de Google - 30-07-2002
- Référencement : le problème des sessions des pages PHP - 04-08-2008
- Bingbot : le nom officiel du robot de Bing - 29-06-2010
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot) - 05-09-2008
- Google Instant Preview : correction du bug Google Analytics - 01-12-2010
Consultez la description détaillée des produits ou services de Google suivants : Google Feed Fetcher, Googlebot
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

