GoogleBot crawle trop vite :((

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

Shift-Zone
WRInaute discret
WRInaute discret
 
Messages: 66
Inscription: 31 Mar 2005

Message le Jeu Mar 31, 2005 15:16

Pour ma part je pense qu'il ne faut pas abuser avec le fichier robots.txt.
A nouveau il faut avoir à l'esprit que chaque ligne ajoutée représente du traitement supplémentaire pour le serveur. Donc quoi qu'il arrive (que ce soit un bot ou un visiteur) le fichier est parcouru et comme le plus souvent ce n'est pas un bot c'est pour rien !

Cette solution impose de préciser le délai pour chaque agent de recherche et quand on voit le nombre de moteurs de recherche existant ...

Si quelqu'un peut donner des chiffres sur l'overhead généré ca m'intéresse !

achaternet
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 256
Inscription: 11 Fév 2003

Message le Jeu Mar 31, 2005 22:13

Shift-Zone a écrit:Donc quoi qu'il arrive (que ce soit un bot ou un visiteur) le fichier est parcouru et comme le plus souvent ce n'est pas un bot c'est pour rien ! !


Non :!:

seul les moteurs utilisent le robots.txt, et eventuellement certains aspirateurs avec un minimum de respect. :wink:

Shift-Zone
WRInaute discret
WRInaute discret
 
Messages: 66
Inscription: 31 Mar 2005

robots.txt

Message le Ven Avr 01, 2005 12:35

exact !

J'étais distrait sur ce coup là, j'avais .htaccess en tête ...
Sorry pour la fausse info.

achaternet
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 256
Inscription: 11 Fév 2003

Message le Mer Avr 06, 2005 8:36

Bon, enfin une reponse de google:

Nous vous remercions d'avoir attiré notre attention sur ce fait. Nous
avons réduit la charge sur vos serveurs. Nous vous prions de nous
excuser
pour le désagrément occasionné et vous remercions de votre patience.
N'hésitez pas à nous contacter pour toutes questions supplémentaires.

Cordialement,
L'équipe Google


Mouai, pas trop de detail...

De plus, si ils font au cas par cas, ils n ont pas finis de recevoir des plaintes.

Vi, je pense aussi a vous autres :wink:

Et aucune infos, aucun code pour le faire ralentir.

Tout ce que j espere, c est que googlebot passera autant qu avant...

C est sans doute un pb de non synchrosation de leurs bots,

cad, ce que j entends par là, c est :

serveur no 1 crawl un domaine
serveur no 2 crawl le meme domaine et NE COMMUNIQUE PAS entre eux, pour ne pas lancer des crawls simultanes de ce domaine.

Ainsi, de facon aleatoire, donc, par moment, TROP de connexions simultanee :twisted: :twisted:

achaternet
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 256
Inscription: 11 Fév 2003

Message le Mer Avr 06, 2005 8:41

User-agent: Googlebot
Crawl-delay: 20


Ne SERT A RIEN.

Voici donc ce que je leur avais ecrit:


Bonjour,

Googlebot passe de maniere trop rapproche.

Exemple pour ce matin: 25 pages en 1 minute

3 connexions simultanées!

Avez vous un truc comme yahoo : Crawl-delay dans le robots.txt ?

Que dois je faire?

voici quelques logs:

....


Il faut savoir aussi, que googlebot et autre ne pouvait pas faire plus, puisque le 60gp chez ovh est 3 conn simult bdd :!:


nautiljon
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 254
Inscription: 23 Mar 2005

Message le Ven Avr 08, 2005 22:56

euh, moi c'est pas google mais Slurp (Inktomi) qui m'a fait une surprise ce soir, jusqu'a aujourd'hui il venait entre 0 et 10 fois par jour, et la 1550pages en 6min soit environs 258pages/min o_o, le pire c'est que mon script a 50p/min l'a pas bloqué zarb.
Le Crawl-delay ne fontionne pas si j'ai bien lu :S y'a une solution ?


Ohax
WRInaute accro
WRInaute accro
 
Messages: 6406
Inscription: 5 Juil 2004

Message le Ven Avr 08, 2005 23:03

ils viennent à plusieurs (plusieurs ips)


nautiljon
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 254
Inscription: 23 Mar 2005

Message le Ven Avr 08, 2005 23:43

Ah wé ! j'avais pas tilté, y'a plusieurs centaines d'ip rien que pour lui !

Cyberbiz
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 2
Inscription: 26 Aoû 2004

Message le Dim Juil 03, 2005 15:53

Cette fonction marche t'elle sinon pour slurp ?

Quelqu'un a t'il un resultat fiable ?

Code: Tout sélectionner
User-agent: Slurp
Crawl-delay: 40

Albert1
WRInaute impliqué
WRInaute impliqué
 
Messages: 935
Inscription: 23 Aoû 2005

Re: GoogleBot crawle trop vite :((

Message le Mer Aoû 31, 2005 21:53

achaternet a écrit:User-agent: Googlebot
Crawl-delay: 20

Totalement inutile !
je viens d'avoir confirmation par mail de Google que googlebot ne reconnaît pas cette commande !
Additionally, it's important to note that Googlebot does not currently
recognize the crawl-delay command.

:roll:

GoogleBot crawle trop vite :((

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités