Nouvelle version Googlebot
8 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

Digit - WRInaute impliqué

- Messages: 613
- Inscription: 18 Avr 2003
Nouvelle version Googlebot
En regardant les logs, on peut identifier 2 bots différents : le classique et un nouveau simulant un browser récent. Ce n'est pas forcément très nouveau, mais ce qui est à la pointe c'est que ce second bot est désormais compatible gzip. Extrait des logs avec les 2 bots :
Ils font des progrès chez Google... Reste plus qu'à mettre le header de langue et ça me plaira bien.
- Code: Tout sélectionner
crawl-66-249-64-169.googlebot.com - - [15/Oct/2004:23:27:34 +0200] "GET /dupuis/ HTTP/1.0" 200 9804 "-" "Googlebot/2.1 (+http://www.google.com/bot.html)" mod_gzip: DECLINED:NO_ACCEPT_ENCODING In:0 Out:0:0pct.
crawl-66-249-64-4.googlebot.com - - [15/Oct/2004:23:27:35 +0200] "GET /broughton/ HTTP/1.0" 200 9760 "-" "Googlebot/2.1 (+http://www.google.com/bot.html)" mod_gzip: DECLINED:NO_ACCEPT_ENCODING In:0 Out:0:0pct.
crawl-66-249-66-203.googlebot.com - - [15/Oct/2004:23:48:13 +0200] "GET /zimbabwe.php?image2=1 HTTP/1.1" 200 6945 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" mod_gzip: DECHUNK:OK In:18257 Out:6945:62pct.
crawl-66-249-66-203.googlebot.com - - [15/Oct/2004:23:48:16 +0200] "GET /linjinan/?pic=-12&l=1 HTTP/1.1" 200 3609 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" mod_gzip: DECHUNK:OK In:12401 Out:3609:71pct.
Ils font des progrès chez Google... Reste plus qu'à mettre le header de langue et ça me plaira bien.
- achaternet
- WRInaute occasionnel

- Messages: 256
- Inscription: 11 Fév 2003
Re: Nouvelle version Googlebot
crawl-66-249-64-169.googlebot.com - - [15/Oct/2004:23:27:34 +0200] "GET /dupuis/ HTTP/1.0" 200 9804 "-" "Googlebot/2.1 (+http://www.google.com/bot.html)" mod_gzip: DECLINED:NO_ACCEPT_ENCODING In:0 Out:0:0pct.
crawl-66-249-66-203.googlebot.com - - [15/Oct/2004:23:48:16 +0200] "GET /linjinan/?pic=-12&l=1 HTTP/1.1" 200 3609 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" mod_gzip: DECHUNK:OK In:12401 Out:3609:71pct.
Je pense qu il parlait de la compression de page en gzip
crawl-66-249-66-203.googlebot.com - - [15/Oct/2004:23:48:16 +0200] "GET /linjinan/?pic=-12&l=1 HTTP/1.1" 200 3609 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" mod_gzip: DECHUNK:OK In:12401 Out:3609:71pct.
Je pense qu il parlait de la compression de page en gzip
-

Digit - WRInaute impliqué

- Messages: 613
- Inscription: 18 Avr 2003
En clair le nouveau bot simule un navigateur en poussant le vice jusqu'à être compatible avec la compression disponible dans le protocole http 1.1
2 impacts :
- si le nouveau bot se généralise, ça aura un impact positif sur notre bande passante car le volume transféré sera moindre pour un même nombre de pages crawlé (et accessoirement Google aura besoin d'une bande passante plus faible pour crawler le web)
- si des pages font du cloaking, Google a le moyen de l'identifier car son bot se rapproche vraiment des caractéristiques d'un navigateur normal (le cloaking ne pourra plus se faire par le user agent mais juste par l'identification de l'ip)
2 impacts :
- si le nouveau bot se généralise, ça aura un impact positif sur notre bande passante car le volume transféré sera moindre pour un même nombre de pages crawlé (et accessoirement Google aura besoin d'une bande passante plus faible pour crawler le web)
- si des pages font du cloaking, Google a le moyen de l'identifier car son bot se rapproche vraiment des caractéristiques d'un navigateur normal (le cloaking ne pourra plus se faire par le user agent mais juste par l'identification de l'ip)
-

WebRankInfo - Administrateur du site

- Messages: 19420
- Inscription: 19 Avr 2002
Digit, vois-tu un rapport entre la détection du cloaking et la gestion du zip ? Si je te suis c'est plutôt que Google développe un bot qui ressemble de plus en plus à un navigateur, non ?
Et toujours pas de Googlebot qui lise des CSS ?
Et toujours pas de Googlebot qui lise des CSS ?
- achaternet
- WRInaute occasionnel

- Messages: 256
- Inscription: 11 Fév 2003
WebRankInfo a écrit:Et toujours pas de Googlebot qui lise des CSS ?
ça, va valoir encore attendre...
D autre bots le font, google va forcement suivre, mais quand, mystere et boule de gomme
-

Digit - WRInaute impliqué

- Messages: 613
- Inscription: 18 Avr 2003
Exactement Olivier, le bot se rapproche de plus en plus du navigateur :
- Gestion aboutie du protocole (compression http1.1)
- identification de certains éléments javascript
- User Agent Mozilla en version avancée (donc à priori conforme aux dernières normes html, xhtml...)
Mais peut-être que Google désire aller au-delà du navigateur en émulant l'utilisateur, ce qui est également bien aboutit
- parcours des sites et navigation de proche en proche
- analyse des documents (autres que pages html)
- estimation de l'importance d'une page
- identification de pages semblables
Le super-bot serait donc un super-utilisateur équipé d'un super-navigateur
- Gestion aboutie du protocole (compression http1.1)
- identification de certains éléments javascript
- User Agent Mozilla en version avancée (donc à priori conforme aux dernières normes html, xhtml...)
Mais peut-être que Google désire aller au-delà du navigateur en émulant l'utilisateur, ce qui est également bien aboutit
- parcours des sites et navigation de proche en proche
- analyse des documents (autres que pages html)
- estimation de l'importance d'une page
- identification de pages semblables
Le super-bot serait donc un super-utilisateur équipé d'un super-navigateur
8 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités


