GoogleBot crawle trop vite :((
25 messages • Page 1 sur 2 • 1, 2
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
- achaternet
- WRInaute impliqué

- Messages: 256
- Inscription: Mar Fév 11, 2003 12:44
GoogleBot crawle trop vite :((
Bonjour,
Je viens de constater, que ce matin googlebot est passe 25 fois en 1 minutes
ça commence a etre trop....
De plus 3 connexions simultanées, la c est TROP
dans robots.txt, vous croyez que ça irait?:
User-agent: Googlebot
Crawl-delay: 20
Comment lui dire, vas y cool, sans penaliser le nombre de pages crawlees dans la journee.
Merci
Je viens de constater, que ce matin googlebot est passe 25 fois en 1 minutes
ça commence a etre trop....
De plus 3 connexions simultanées, la c est TROP
dans robots.txt, vous croyez que ça irait?:
User-agent: Googlebot
Crawl-delay: 20
Comment lui dire, vas y cool, sans penaliser le nombre de pages crawlees dans la journee.
Merci
en effet
ça permettrait à mon script anti aspirateur d'eviter de bannir son ip
je ne connaissait pas cette fonction dans le robots.txt
Crawl-delay: 20
tu es sur que ça existe? que ça marche?
ça ne risque pas de pénaliser?
j'attend vos réponses
merci a vous
ça permettrait à mon script anti aspirateur d'eviter de bannir son ip
je ne connaissait pas cette fonction dans le robots.txt
Crawl-delay: 20
tu es sur que ça existe? que ça marche?
ça ne risque pas de pénaliser?
j'attend vos réponses
merci a vous
En tout les cas cette fonction existe pour Yahoo Slurp:
http://www.webrankinfo.com/yahoo/faq_31_172.htm
http://www.webrankinfo.com/yahoo/faq_31_172.htm
http://www.searchengineworld.com/cgi-bin/robotcheck.cgi
mon robots.txt à une erreur avec ces deux lignes en plus
mon robots.txt à une erreur avec ces deux lignes en plus
- Code: Tout sélectionner
http status: 200 OK
Syntax check robots.txt on http://www.adojeunz.com/robots.txt (1725 bytes)
Line Severity Code
53 ERROR Invalid fieldname:
Crawl-delay: 20
We're sorry, this robots.txt does NOT validate.
Warnings Detected: 0
Errors Detected: 1
robots.txt source code for http://www.adojeunz.com/robots.txt
Line Code
1 User-agent: Mediapartners-Google*
2 Disallow:
3
4 User-agent: *
5 Disallow: /nancy
6 Disallow: /banni
7 Disallow: /viewtopic.php
8 Disallow: /viewforum.php
9 Disallow: /memberlist.php
10 Disallow: /login.php
11 Disallow: /faq.php
12 Disallow: /modcp.php
13 Disallow: /posting.php
14 Disallow: /privmsg.php
15 Disallow: /search.php
16 Disallow: /viewonline.php
17 Disallow: /profile.php
18 Disallow: /groupcp.php
19 Disallow: /newtopic
20 Disallow: /setopic
21 Disallow: /stopic
22 Disallow: /ntopic
23 Disallow: /ptopic
24 Disallow: /ftopic1
25 Disallow: /ftopic2
26 Disallow: /ftopic3
27 Disallow: /ftopic4
28 Disallow: /ftopic5
29 Disallow: /ftopic6
30 Disallow: /ftopic7
31 Disallow: /ftopic8
32 Disallow: /ftopic9
33 Disallow: /airsoft/viewtopic.php
34 Disallow: /airsoft/viewforum.php
35 Disallow: /airsoft/memberlist.php
36 Disallow: /airsoft/login.php
37 Disallow: /airsoft/faq.php
38 Disallow: /airsoft/modcp.php
39 Disallow: /airsoft/posting.php
40 Disallow: /airsoft/privmsg.php
41 Disallow: /airsoft/search.php
42 Disallow: /airsoft/viewonline.php
43 Disallow: /airsoft/profile.php
44 Disallow: /airsoft/groupcp.php
45 Disallow: /airsoft/newtopic
46 Disallow: /airsoft/setopic
47 Disallow: /airsoft/stopic
48 Disallow: /airsoft/profile
49 Disallow: /airsoft/ntopic
50 Disallow: /airsoft/ptopic
51
52 User-agent: Slurp
53 Crawl-delay: 20
54
55 User-agent: pompos
56 Disallow: /
57
58 User-agent: turnitinbot
59 Disallow: /
60
61 User-agent: QuepasaCreep
62 Disallow: /
63
64 User-agent: NPBot
65 Disallow: /
66
67 User-agent: ConveraMultiMediaCrawler
68 Disallow: /
69
70 User-agent: linkwalker
71 Disallow: /
72
73 User-agent: NPBot-1/2.0
74 Disallow: /
75
76 User-agent: NPBot-1/2.0 (http://www.nameprotect.com/botinfo.html)
77 Disallow: /
78
79 User-agent: Steeler
80 Disallow: /
81
82 User-agent: minibot(NaverRobot)/1.0
83 Disallow: /
84
85 User-agent: linksmanager
86 Disallow: /
87
88 User-agent: Wget
89 Disallow: /
90
91 User-agent: IRLbot
92 Disallow: /
- achaternet
- WRInaute impliqué

- Messages: 256
- Inscription: Mar Fév 11, 2003 12:44
cthierry a écrit:En tout les cas cette fonction existe pour Yahoo Slurp:
http://www.webrankinfo.com/yahoo/faq_31_172.htm
c est de là que je me suis inspire.
http://www.searchengineworld.com/cgi-bin/robotcheck.cgi
mon robots.txt à une erreur avec ces deux lignes en plus
vu avec Slurp.
Moi aussi, Ohax, c est pour un complement d un script perso qui bloque les pompeurs fous, ... et dans mon cas de ce matin, google etait vraiment trop limite.
Dernière édition par achaternet le Sam Mar 26, 2005 15:51, édité 2 fois.
mmmm je doit laisser mon robots.txt comme cela?
http://www.adojeunz.com/robots.txt
et pour google comment le ralentir?
http://www.adojeunz.com/robots.txt
et pour google comment le ralentir?
- achaternet
- WRInaute impliqué

- Messages: 256
- Inscription: Mar Fév 11, 2003 12:44
bon, j'ai mis:
car msnbot utilise aussi crawl-delay
(cf -http://search.sympatico.msn.ca/docs/siteowner.aspx?t=SEARCH_WEBMASTER_REF_RestrictAccessToSite.htm&setlang=fr-CA&FORM=LTWM tout en bas )
Ainsi, j'ai de gros doutes sur -http://www.searchengineworld.com/cgi-bin/robotcheck.cgi ...
Je vais regarder si ca va mieux dans 24h.
Si qq1 a des infos sur Crawl-delay et googlebot, dite le !
User-agent: Googlebot
Crawl-delay: 10
User-agent: msnbot
Crawl-delay: 10
User-agent: Slurp
Crawl-delay: 10
car msnbot utilise aussi crawl-delay
(cf -http://search.sympatico.msn.ca/docs/siteowner.aspx?t=SEARCH_WEBMASTER_REF_RestrictAccessToSite.htm&setlang=fr-CA&FORM=LTWM tout en bas )
Ainsi, j'ai de gros doutes sur -http://www.searchengineworld.com/cgi-bin/robotcheck.cgi ...
Je vais regarder si ca va mieux dans 24h.
Si qq1 a des infos sur Crawl-delay et googlebot, dite le !
- achaternet
- WRInaute impliqué

- Messages: 256
- Inscription: Mar Fév 11, 2003 12:44
Vu que ca patoge, et je veux en finir rapidement,
je leur ecris sur leur support.
on verra bien.
Remarque, rapidement une reponse de leur part, j en doute

on verra bien.
Remarque, rapidement une reponse de leur part, j en doute
- achaternet
- WRInaute impliqué

- Messages: 256
- Inscription: Mar Fév 11, 2003 12:44
allez admirer:
/Gastronomie-38.html 200 [03-26]
09:14:16 1 66.249.71.32 crawl-66-249-71-32.googlebot.com
54 /Musique-60.html 200 [03-26]
09:14:16 1 66.249.64.55 crawl-66-249-64-55.googlebot.com
55 /Achats%20en%20ligne-1.html 200 [03-26]
09:14:17 1 66.249.64.68 crawl-66-249-64-68.googlebot.com
56 /Anal-198.html 200 [03-26]
09:14:17 1 66.249.64.58 crawl-66-249-64-58.googlebot.com
57 /Motel-200.html 200 [03-26]
09:14:17 1 66.249.71.29 crawl-66-249-71-29.googlebot.com
58 /Football-268.html 200 [03-26]
09:14:18 1 66.249.71.69 crawl-66-249-71-69.googlebot.com

/Gastronomie-38.html 200 [03-26]
09:14:16 1 66.249.71.32 crawl-66-249-71-32.googlebot.com
54 /Musique-60.html 200 [03-26]
09:14:16 1 66.249.64.55 crawl-66-249-64-55.googlebot.com
55 /Achats%20en%20ligne-1.html 200 [03-26]
09:14:17 1 66.249.64.68 crawl-66-249-64-68.googlebot.com
56 /Anal-198.html 200 [03-26]
09:14:17 1 66.249.64.58 crawl-66-249-64-58.googlebot.com
57 /Motel-200.html 200 [03-26]
09:14:17 1 66.249.71.29 crawl-66-249-71-29.googlebot.com
58 /Football-268.html 200 [03-26]
09:14:18 1 66.249.71.69 crawl-66-249-71-69.googlebot.com
- achaternet
- WRInaute impliqué

- Messages: 256
- Inscription: Mar Fév 11, 2003 12:44
La fonction Crawl-delay ne marche pas avec ggbot, la preuve:
[03-26] 16:16:21
[03-26] 16:16:19
[03-26] 16:16:08
[03-26] 16:16:06
[03-26] 16:16:03
chiotte
[03-26] 16:16:21
[03-26] 16:16:19
[03-26] 16:16:08
[03-26] 16:16:06
[03-26] 16:16:03
chiotte
25 messages • Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- La danse de Googlebot :-) La Google Dance
- Google crawle les fichiers CSS
- Etude de Googlebot, le robot d'indexation de Google
- Googlebot analyse certains codes JavaScript
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- Le Full Crawl a enfin commencé
- Robots.txt : Yahoo supporte les options avancées
- Les adresses IP de Google et Googlebot
- La Google Dance existe-elle encore ?
- Présentation de l'indexation Google - Googlebot, le robot de Google
Consultez la description détaillée des produits ou services de Google suivants : Googlebot
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités




le forum