Des crawlers un peu trop gourmand
8 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

ACR Ing - WRInaute discret

- Messages: 61
- Inscription: 10 Juil 2007
Des crawlers un peu trop gourmand
Salut,
J'ai mon site qui est out depuis hier. Bon c'est vrai que j'ai une augmentation de trafic mais il a déjà tenu 13000 visiteurs unique / j et là j'en suis à 5000. Pour info, ce site avait subit une pénalité de la part de Google et il commence maintenant à redécoller suite à de nombreuses modifications. Bref, ce n'est pas le sujet du message. C'est la base de données qui est mal menée alors qu'il y a un système de cache. Je suis allé voir les logs et à priori, ce serait le bots de voila qui crawl comme un cinglé mon site (et les autres bots sont bien présents aussi). Avez-vous des astuces pour réguler le trafic des bots sur vos sites ?
D'avance merci
Bertrand
J'ai mon site qui est out depuis hier. Bon c'est vrai que j'ai une augmentation de trafic mais il a déjà tenu 13000 visiteurs unique / j et là j'en suis à 5000. Pour info, ce site avait subit une pénalité de la part de Google et il commence maintenant à redécoller suite à de nombreuses modifications. Bref, ce n'est pas le sujet du message. C'est la base de données qui est mal menée alors qu'il y a un système de cache. Je suis allé voir les logs et à priori, ce serait le bots de voila qui crawl comme un cinglé mon site (et les autres bots sont bien présents aussi). Avez-vous des astuces pour réguler le trafic des bots sur vos sites ?
D'avance merci
Bertrand
-

UsagiYojimbo - WRInaute accro

- Messages: 8575
- Inscription: 23 Nov 2005
Re: Des crawlers un peu trop gourmand
Tu peux le bloquer le temps qu'il se calme (vu l'apport de visite de Voilà, ça devrait pas changer grand chose) :
- Code: Tout sélectionner
RewriteCond %{HTTP_USER_AGENT} VoilaBot
RewriteRule .* - [F,L]
-

petitchevalroux - WRInaute discret

- Messages: 190
- Inscription: 31 Mai 2006
Re: Des crawlers un peu trop gourmand
De manière générale j'utilise un script qui bloque le visiteur/bot au bout d'un certain nombre de requêtes par seconde http://sourceforge.net/projects/apcanticrawler/ bon c'est basé sur APC donc il faut auparavant l'installer 
-

petitchevalroux - WRInaute discret

- Messages: 190
- Inscription: 31 Mai 2006
Re: Des crawlers un peu trop gourmand
Arf tu peux faire un peux le même truc en utilisant des fichiers pour stocker le nombre de requetes par seconde par IP C'est GPL donc si tu veux t'en inspirer y a pas de problème 
8 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- adresse ip des crawlers ??
- Tracking des crawlers
- Différence des Crawlers
- Excitation des crawlers
- Liste des crawlers yahoo
- Incrémentation avec exclusion des crawlers
- Detection des bots et crawlers avec google analytics ?
- [Crawler] Code de bonne conduite des visites de crawlers
- Google, gros gourmand va...
- Robot amazon très gourmand
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
