Nouveau site est pas de Googlebot officiel, mais la visite d'un bot noname ...
8 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- gnupower
- Nouveau WRInaute

- Messages: 36
- Inscription: 28 Avr 2008
Nouveau site est pas de Googlebot officiel, mais la visite d
Bonsoir,
Le 12 janvier j'ai lancé un nouveau site. Afin de faire un test, j'ai décidé de ne pas le soumettre à Google ni à ces petits copains. J'attends sagement qu'il découvre mon site via quelques liens qui sont disséminés sur la toile.
Je vérifie régulièrement mes logs afin de savoir quand enfin il va ce décider à visiter mon site.
J'utilise la commande suivante pour détecter son passage :
grep Googlebot access_log
Ce que je trouve étrange ce n'est pas sa non venu ce qui me paraitrait normal, mais la venu d'un robot provenant de chez Google, mais qui ne s'annonce pas et qui ne respecte absolument rien.
grep 66.249* access_log
example.com 66.249.67.27 [17/Jan/2009:14:28:46 +0000] "GET / HTTP/1.1" 200 17983
example.com 66.249.67.27 [19/Jan/2009:02:36:24 +0000] "GET /robots.txt HTTP/1.1" 200 783
example.com 66.249.67.27 [18/Jan/2009:23:21:37 +0000] "GET /rep1/ HTTP/1.1" 200 15554
example.com 66.249.67.27 [19/Jan/2009:00:28:17 +0000] "GET /rep2/sous-rep3/ HTTP/1.1" 200 9949
example.com 66.249.67.27 [19/Jan/2009:09:00:57 +0000] "GET / HTTP/1.1" 200 17983
example.com 66.249.67.27 [19/Jan/2009:16:31:11 +0000] "GET /vcssratkq.html HTTP/1.1" 404 5080
Il suit les liens en nofollow, il suit des pages qui lui sont interdites via un fichier robots.txt, etc.
Qui plus est; il va sur des pages (Ex : 404), qui n'ont jamais existé.
Avez-vous déjà vu ça sur vos sites ?
Pour votre information la plage d'IP appartient à Google.
whois 66.249.67.27
OrgName: Google Inc.
OrgID: GOGL
Address: 1600 Amphitheatre Parkway
City: Mountain View
StateProv: CA
PostalCode: 94043
Country: US
NetRange: 66.249.64.0 - 66.249.95.255
CIDR: 66.249.64.0/19
NetName: GOOGLE
NetHandle: NET-66-249-64-0-1
Parent: NET-66-0-0-0-0
NetType: Direct Allocation
NameServer: NS1.GOOGLE.COM
NameServer: NS2.GOOGLE.COM
NameServer: NS3.GOOGLE.COM
NameServer: NS4.GOOGLE.COM
Comment:
RegDate: 2004-03-05
Updated: 2007-04-10
OrgTechHandle: ZG39-ARIN
OrgTechName: Google Inc.
OrgTechPhone: +1-650-318-0200
OrgTechEmail: arin-contact@google.com
Geekement votre,
Un curieux qui recherche d'autres curieux afin de faire un croisement d'information
Le 12 janvier j'ai lancé un nouveau site. Afin de faire un test, j'ai décidé de ne pas le soumettre à Google ni à ces petits copains. J'attends sagement qu'il découvre mon site via quelques liens qui sont disséminés sur la toile.
Je vérifie régulièrement mes logs afin de savoir quand enfin il va ce décider à visiter mon site.
J'utilise la commande suivante pour détecter son passage :
grep Googlebot access_log
Ce que je trouve étrange ce n'est pas sa non venu ce qui me paraitrait normal, mais la venu d'un robot provenant de chez Google, mais qui ne s'annonce pas et qui ne respecte absolument rien.
grep 66.249* access_log
example.com 66.249.67.27 [17/Jan/2009:14:28:46 +0000] "GET / HTTP/1.1" 200 17983
example.com 66.249.67.27 [19/Jan/2009:02:36:24 +0000] "GET /robots.txt HTTP/1.1" 200 783
example.com 66.249.67.27 [18/Jan/2009:23:21:37 +0000] "GET /rep1/ HTTP/1.1" 200 15554
example.com 66.249.67.27 [19/Jan/2009:00:28:17 +0000] "GET /rep2/sous-rep3/ HTTP/1.1" 200 9949
example.com 66.249.67.27 [19/Jan/2009:09:00:57 +0000] "GET / HTTP/1.1" 200 17983
example.com 66.249.67.27 [19/Jan/2009:16:31:11 +0000] "GET /vcssratkq.html HTTP/1.1" 404 5080
Il suit les liens en nofollow, il suit des pages qui lui sont interdites via un fichier robots.txt, etc.
Qui plus est; il va sur des pages (Ex : 404), qui n'ont jamais existé.
Avez-vous déjà vu ça sur vos sites ?
Pour votre information la plage d'IP appartient à Google.
whois 66.249.67.27
OrgName: Google Inc.
OrgID: GOGL
Address: 1600 Amphitheatre Parkway
City: Mountain View
StateProv: CA
PostalCode: 94043
Country: US
NetRange: 66.249.64.0 - 66.249.95.255
CIDR: 66.249.64.0/19
NetName: GOOGLE
NetHandle: NET-66-249-64-0-1
Parent: NET-66-0-0-0-0
NetType: Direct Allocation
NameServer: NS1.GOOGLE.COM
NameServer: NS2.GOOGLE.COM
NameServer: NS3.GOOGLE.COM
NameServer: NS4.GOOGLE.COM
Comment:
RegDate: 2004-03-05
Updated: 2007-04-10
OrgTechHandle: ZG39-ARIN
OrgTechName: Google Inc.
OrgTechPhone: +1-650-318-0200
OrgTechEmail: arin-contact@google.com
Geekement votre,
Un curieux qui recherche d'autres curieux afin de faire un croisement d'information
-

Audiofeeline - WRInaute accro

- Messages: 5257
- Inscription: 20 Oct 2005
C'est bien Googlebot qui fait son travail.
Il fouine tout pour comprendre la structure du site.
Ces derniers mois il est devenu très virulent du fait de la recherche "en temps réel".
Si tu le trouves un peu trop gourmand tu peux le calmer dans Google Webmasters Tools.
Il fouine tout pour comprendre la structure du site.
Ces derniers mois il est devenu très virulent du fait de la recherche "en temps réel".
Si tu le trouves un peu trop gourmand tu peux le calmer dans Google Webmasters Tools.
- gnupower
- Nouveau WRInaute

- Messages: 36
- Inscription: 28 Avr 2008
Je ne confonds pas. Ce n'est pas le robot de Google qui passe sur mon site.
Le robot officiel ce présent sou la forme :
66.249.66.16 - - [21/Jan/2009:11:19:26 +0100] "GET /robots.txt HTTP/1.1" 200 796 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
Le mystère reste donc entier.
Le robot officiel ce présent sou la forme :
66.249.66.16 - - [21/Jan/2009:11:19:26 +0100] "GET /robots.txt HTTP/1.1" 200 796 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
Le mystère reste donc entier.
8 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Nouveau bot (Googlebot/Test) ???
- logs visite de googlebot juste après visite nat
- Google Wireless Transcoder : vieux Bot ou nouveau Bot ?
- Frequence de visite du bot google
- PAs une seule visite de GG bot
- googlebot ne me visite plus
- msn bot me compte une visite à chaque passage
- plus de visite de msnbot que de googlebot
- Nombre max de pages vues par le bot à sa visite
- Google bot ne visite pas toutes mes pages
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- La danse de Googlebot :-) La Google Dance
- Etude de Googlebot, le robot d'indexation de Google
- Mise à jour de Google Images (Juillet 2006)
- Mise à jour de Google Images (16/04/2006)
- Google Instant Preview : correction du bug Google Analytics
- Topeka : le nouveau nom officiel de Google
- Googlebot, le robot d'indexation de Google
Consultez la description détaillée des produits ou services de Google suivants : Googlebot
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité

