TwengaBot/1.1 à bannir?
11 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
TwengaBot/1.1 à bannir?
Les robots de ce comparateur de prix dont la plage d'IP 85.17.196.128 à 85.17.196.135 parcourent quotidiennement jusquà 15000 pages dans la journée d'un de mes sites d'e-commerce (1100 produits environ sous oscommerce) .
Il a même réussi à me faire planter par 2 fois MySQL dans le mois pour un "exceeded the 'max_questions' resource" de 60000 par heure, c'est tout dire.
La plupart des comparateurs de prix vont chercher un fichier spécifique qui génére la liste des produits et les infos dont ils ont besoin, c'est le cas du guide.com ou de Kelkoo. Je ne comprends pas qu'une telle m...e puisse exister.
De plus le site en question n'a jamais sollicité la venue de Twenga, encore une fois, les autres comparateurs requiérent une inscription.
A vos deny (robots.txt) ou vos scripts PHP pour en interdire l'accès si ce robot vous occasionne des problèmes.
Il a même réussi à me faire planter par 2 fois MySQL dans le mois pour un "exceeded the 'max_questions' resource" de 60000 par heure, c'est tout dire.
La plupart des comparateurs de prix vont chercher un fichier spécifique qui génére la liste des produits et les infos dont ils ont besoin, c'est le cas du guide.com ou de Kelkoo. Je ne comprends pas qu'une telle m...e puisse exister.
De plus le site en question n'a jamais sollicité la venue de Twenga, encore une fois, les autres comparateurs requiérent une inscription.
A vos deny (robots.txt) ou vos scripts PHP pour en interdire l'accès si ce robot vous occasionne des problèmes.
Dernière édition par patriceAB le Ven Juil 04, 2008 1:38, édité 1 fois.
- ChristopheDuman
- Nouveau WRInaute
- Messages: 48
- Inscription: Ven Juil 04, 2008 0:43
Salut, tu as juste à faire ça au lieu de le bannir :
User-agent: TwengaBot
Crawl-delay: 50
Voilà
.
User-agent: TwengaBot
Crawl-delay: 50
Voilà
Salut, tu as juste à faire ça au lieu de le bannir :
User-agent: TwengaBot
Crawl-delay: 50
C'est une très bonne idée, merci pour le tuyau.
Mais je ne suis pas certain qu'un robot aussi mal conçu respecte le Crawl-delay.
Comme c'est un comparateur , il va continuer à crawler toutes les pages du site au quotidien en générant des milliers de requêtes. Je vois plusieurs IP's de ce même comparateur parfois dans le même journée.
Je vais les contacter pour savoir si leur robot le respecte (le Crawl-delay). On verra si ils me répondent.
- ChristopheDuman
- Nouveau WRInaute
- Messages: 48
- Inscription: Ven Juil 04, 2008 0:43
Je pense qu'ils ne réponderont pas...
Teste, si ça fait encore ça, là, mets un bon :
User-agent: TwengaBot
Dissalow: /
Voilà
.
Teste, si ça fait encore ça, là, mets un bon :
User-agent: TwengaBot
Dissalow: /
Voilà
C'est le site d'un client, j'ai un peu peur de tester. Un site d'e-commerce ça la fout mal quand ça plante surtout quand il y a des clients qui font leurs achats.
.
Le dernier plantage a duré 8 heures, j'en ai ma dose de Twenga.
Je crois que je vais opter pour le bon :
User-agent: TwengaBot
Dissalow: /
ou plutôt Disallow: / avec un seul s ça marchera mieux
Le dernier plantage a duré 8 heures, j'en ai ma dose de Twenga.
Je crois que je vais opter pour le bon :
User-agent: TwengaBot
Dissalow: /
ou plutôt Disallow: / avec un seul s ça marchera mieux
- ChristopheDuman
- Nouveau WRInaute
- Messages: 48
- Inscription: Ven Juil 04, 2008 0:43
Ah, o_O. Fais-le ouep :p.
The TwengaBot also fully supports the robots.txt protocol, particularly the crawl-delay instruction.
http://www.twenga.com/bot.html
- ChristopheDuman
- Nouveau WRInaute
- Messages: 48
- Inscription: Ven Juil 04, 2008 0:43
TwengaBot tout court ;o).
11 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Bannir
- Bannir via htaccess
- Bannir un membre
- bannir une ip ?
- Bien bannir qqun ?
- bannir par cookie
- Mots à bannir pour google
- Adsense arrête pas de me bannir ...
- Domaine indésirable, comment le bannir ?
- Bannir les crawls de particulier...
- Pourquoi bannir les javascripts ?
- Bannir une plage d'IP via le htaccess
- A bannir de vos mentions légales... à lire - Urgent !!!
- Comment bannir une personne légalement ?
- faire bannir un compte google adsense ?
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités






le forum