Googlebot et changement d'adresse IP pendant le full crawl
4 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Googlebot et changement d'adresse IP pendant le full crawl
Hello
Je viens de constater une chose assez bizarre avec GoogleBot : si un site change d'adresse IP pendant le full crawl, GoogleBot conserve la première IP visitée pour aller chercher les pages et suivre les liens...
Bien evidemment l'adresse IP1 n'est pas forcément censée répondre aux requetes, puisque le site ne se trouve plus dessus mais sur IP2. Pourquoi google ne réinterroge pas les serveurs DNS avant d'essayer de chercher la page, ou du moins quand il ne trouve plus le site sur IP1 ?
Quelqu'un a-t-il déjà rencontré ce genre de problème et si oui quelles ont été les conséquences ? Y a-t-il des solutions pour l'éviter ?
Fred
Je viens de constater une chose assez bizarre avec GoogleBot : si un site change d'adresse IP pendant le full crawl, GoogleBot conserve la première IP visitée pour aller chercher les pages et suivre les liens...
Bien evidemment l'adresse IP1 n'est pas forcément censée répondre aux requetes, puisque le site ne se trouve plus dessus mais sur IP2. Pourquoi google ne réinterroge pas les serveurs DNS avant d'essayer de chercher la page, ou du moins quand il ne trouve plus le site sur IP1 ?
Quelqu'un a-t-il déjà rencontré ce genre de problème et si oui quelles ont été les conséquences ? Y a-t-il des solutions pour l'éviter ?
Fred
J'ai lu récemment un article (une réponse de Google.fr sur la lettre d'avril d'Abondance) qui explique que :
1°) Pour aller plus vite, Google stocke les ip correspondant aux adresses url qu'il doit visiter
2°) Cette base n'est pas remise à jour en permanence
3°) Google met à jour les DNS juste avant la Googledance
Donc, pour changer d'IP, il faut savoir viser le bon moment... C'est à dire entre un full crawl et la dance suivante. Sinon problème...
1°) Pour aller plus vite, Google stocke les ip correspondant aux adresses url qu'il doit visiter
2°) Cette base n'est pas remise à jour en permanence
3°) Google met à jour les DNS juste avant la Googledance
Donc, pour changer d'IP, il faut savoir viser le bon moment... C'est à dire entre un full crawl et la dance suivante. Sinon problème...
Dernière édition par cariboo le Dim Avr 20, 2003 21:33, édité 1 fois.
Info intéressante effectivement... c'est vrai que le fait de retenir une seule adresse IP avant le full crawl doit faire économiser une certaine bande passante en évitant la résolution DNS (une requete DNS ne représente rien en terme de BP, mais multiplié par le nombre de sites et de pages que google indexe...)
Sinon pour ce qui est du moment de la détermination de cette adresse IP, j'aurais plutot tendance a penser que c'est réalisé au moment du premier passage du robot Full Crawl... j'ai pu le constater parce que je me suis fait avoir pour un site mais un autre est OK (alors que les deux IP ont changé)
En bref, c'est pas une bonne nouvelle pour ceux qui hébergent sur une ligne ADSL avec un DNS dynamique... reste a savoir si qq1 a déjà mesuré les conséquences d'un tel changement... Google remet peut etre à jour les IP des sites en cours de Full Crawl, en tout cas je vous tiendrai au courant...
Fred
Sinon pour ce qui est du moment de la détermination de cette adresse IP, j'aurais plutot tendance a penser que c'est réalisé au moment du premier passage du robot Full Crawl... j'ai pu le constater parce que je me suis fait avoir pour un site mais un autre est OK (alors que les deux IP ont changé)
En bref, c'est pas une bonne nouvelle pour ceux qui hébergent sur une ligne ADSL avec un DNS dynamique... reste a savoir si qq1 a déjà mesuré les conséquences d'un tel changement... Google remet peut etre à jour les IP des sites en cours de Full Crawl, en tout cas je vous tiendrai au courant...
Fred
4 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Le Full Crawl a enfin commencé
- Le début du full crawl
- Début du Full Crawl
- Petit changement pour Slurp (le robot de Yahoo)
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- La vie d'une page sur le web : Fresh Crawl, Deep Crawl, Google Dance
- La danse de Googlebot :-) La Google Dance
- Configurer les options de passage de Googlebot sur son site
- Googlebot, le robot d'indexation de Google
- Sortie officielle de GoogleStats v2.0 !
- Frequence des full crawl de googlebot
- Changement d'url avant le Full Crawl ?
- But du full crawl?
- Full Crawl
- Prochain full crawl
- Un full crawl... chinois :)
- Forcer un full crawl ...?
- Full crawl démarré !
- Inktomi full crawl ??
- Help : full crawl en googlestats
- Full crawl octobre 2004
- Full crawl ? [qui n'existe plus]
- différence entre crawl.googlebot et crawler.googlebot ?
- Full crawl trés incomplet
- pb dans l'alerte Full Crawl
Consultez la description détaillée des produits ou services de Google suivants : Googlebot
- La classe C de l'adresse IP
Cet outil vous permet de vérifier si plusieurs sites sont hébergés sur la même classe C (adresse IP du serveur).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités





le forum