Googlebot et changement d'adresse IP pendant le full crawl
4 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- iconso
- WRInaute occasionnel

- Messages: 446
- Inscription: 8 Avr 2003
Googlebot et changement d'adresse IP pendant le full crawl
Hello
Je viens de constater une chose assez bizarre avec GoogleBot : si un site change d'adresse IP pendant le full crawl, GoogleBot conserve la première IP visitée pour aller chercher les pages et suivre les liens...
Bien evidemment l'adresse IP1 n'est pas forcément censée répondre aux requetes, puisque le site ne se trouve plus dessus mais sur IP2. Pourquoi google ne réinterroge pas les serveurs DNS avant d'essayer de chercher la page, ou du moins quand il ne trouve plus le site sur IP1 ?
Quelqu'un a-t-il déjà rencontré ce genre de problème et si oui quelles ont été les conséquences ? Y a-t-il des solutions pour l'éviter ?
Fred
Je viens de constater une chose assez bizarre avec GoogleBot : si un site change d'adresse IP pendant le full crawl, GoogleBot conserve la première IP visitée pour aller chercher les pages et suivre les liens...
Bien evidemment l'adresse IP1 n'est pas forcément censée répondre aux requetes, puisque le site ne se trouve plus dessus mais sur IP2. Pourquoi google ne réinterroge pas les serveurs DNS avant d'essayer de chercher la page, ou du moins quand il ne trouve plus le site sur IP1 ?
Quelqu'un a-t-il déjà rencontré ce genre de problème et si oui quelles ont été les conséquences ? Y a-t-il des solutions pour l'éviter ?
Fred
-

cariboo - WRInaute impliqué

- Messages: 770
- Inscription: 8 Fév 2003
J'ai lu récemment un article (une réponse de Google.fr sur la lettre d'avril d'Abondance) qui explique que :
1°) Pour aller plus vite, Google stocke les ip correspondant aux adresses url qu'il doit visiter
2°) Cette base n'est pas remise à jour en permanence
3°) Google met à jour les DNS juste avant la Googledance
Donc, pour changer d'IP, il faut savoir viser le bon moment... C'est à dire entre un full crawl et la dance suivante. Sinon problème...
1°) Pour aller plus vite, Google stocke les ip correspondant aux adresses url qu'il doit visiter
2°) Cette base n'est pas remise à jour en permanence
3°) Google met à jour les DNS juste avant la Googledance
Donc, pour changer d'IP, il faut savoir viser le bon moment... C'est à dire entre un full crawl et la dance suivante. Sinon problème...
Dernière édition par cariboo le Dim Avr 20, 2003 21:33, édité 1 fois.
- iconso
- WRInaute occasionnel

- Messages: 446
- Inscription: 8 Avr 2003
Info intéressante effectivement... c'est vrai que le fait de retenir une seule adresse IP avant le full crawl doit faire économiser une certaine bande passante en évitant la résolution DNS (une requete DNS ne représente rien en terme de BP, mais multiplié par le nombre de sites et de pages que google indexe...)
Sinon pour ce qui est du moment de la détermination de cette adresse IP, j'aurais plutot tendance a penser que c'est réalisé au moment du premier passage du robot Full Crawl... j'ai pu le constater parce que je me suis fait avoir pour un site mais un autre est OK (alors que les deux IP ont changé)
En bref, c'est pas une bonne nouvelle pour ceux qui hébergent sur une ligne ADSL avec un DNS dynamique... reste a savoir si qq1 a déjà mesuré les conséquences d'un tel changement... Google remet peut etre à jour les IP des sites en cours de Full Crawl, en tout cas je vous tiendrai au courant...
Fred
Sinon pour ce qui est du moment de la détermination de cette adresse IP, j'aurais plutot tendance a penser que c'est réalisé au moment du premier passage du robot Full Crawl... j'ai pu le constater parce que je me suis fait avoir pour un site mais un autre est OK (alors que les deux IP ont changé)
En bref, c'est pas une bonne nouvelle pour ceux qui hébergent sur une ligne ADSL avec un DNS dynamique... reste a savoir si qq1 a déjà mesuré les conséquences d'un tel changement... Google remet peut etre à jour les IP des sites en cours de Full Crawl, en tout cas je vous tiendrai au courant...
Fred
4 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Frequence des full crawl de googlebot
- Changement d'url avant le Full Crawl ?
- Googlebot remplace Googlebot-News pour le crawl des actualités
- But du full crawl?
- Full Crawl
- Prochain full crawl
- Un full crawl... chinois :)
- Forcer un full crawl ...?
- différence entre crawl.googlebot et crawler.googlebot ?
- Full crawl démarré !
- Le Full Crawl a enfin commencé
- Google Actualités crawle désormais avec le Googlebot classique
- Le début du full crawl
- Petit changement pour Slurp (le robot de Yahoo)
- La danse de Googlebot :-) La Google Dance
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- Début du Full Crawl
- Configurer les options de passage de Googlebot sur son site
Consultez la description détaillée des produits ou services de Google suivants : Googlebot
- La classe C de l'adresse IP
Cet outil vous permet de vérifier si plusieurs sites sont hébergés sur la même classe C (adresse IP du serveur).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

