Cache Google mise à jour sans visite de Googlebot ?

WRInaute accro
Bonjour,

Je sais que c'est fort de café, mais, depuis quelques jours, pour certaines pages d'un de mes sites, je vois des mises à jour de la cache Google sans qu'il n'y ait de visite de Googlebot dans les log Apache (il n'y a même eu aucun visiteur à ces moments précis pour ces pages). Une de ces pages a d'ailleurs été modifiée le 26 novembre et c'est toujours son ancien contenu qui est dans la cache Google datée du 12 décembre. 8O

Explications possibles :
- l'hébergeur fait un cloacking pour Google (mais il dit que non);
- bug Apache;
- bug Google.

Si c'est un bug Apache ou Google, je n'ai jamais entendu parler de ce genre de bug. Avez-vous une idée ?

Jean-Luc
 
WRInaute occasionnel
question bête mais lorsque tu as regardé s'il y avait eu une visite à cette heure là tu as pensé au décalage horaire entre ton serveur et l'heure GMT ?
car c'est fort là en effet..
 
WRInaute accro
Personnellement ça m'arrive fréquemment, Google indique page mise en cache le tant et quand on regarde la date sur les pages mises en cache, il y a plusieurs jours de retard.
Google ment ? Oui !

Edit : pour la précision pas de visites de GGbot dans les logs comme pour JL.
 
WRInaute accro
Toutou-Fr a dit:
question bête mais lorsque tu as regardé s'il y avait eu une visite à cette heure là tu as pensé au décalage horaire entre ton serveur et l'heure GMT ?
car c'est fort là en effet..
Oui, j'ai tenu compte de ce que l'heure locale = GMT+1.

Et même à supposer que j'ai mal regardé dans le fichier log, qu'est-ce qui expliquerait que cette page dont la date en cache Google est le 12 décembre, affiche le contenu antérieur au 26 novembre. C'est une page HTML statique et, avec FTP, je peux voir que le fichier correspondant a été modifié pour la dernière fois, le 26 novembre.

Cache Google du 12 décembre sans la balise <META NAME="robots" CONTENT="noindex"> ajoutée le 26 novembre.

Jean-Luc
 
WRInaute occasionnel
jeanluc a dit:
Cache Google du 12 décembre sans la balise <META NAME="robots" CONTENT="noindex"> ajoutée le 26 novembre.

Jean-Luc

je pense que c'est là qu'est la réponse...ca ne m'étonnerait pas que google ait prévu d'actualiser le cache ce jour là..et donc ait actualisé la date du cache, mais ayant rencontré la balise noindex , il se serait selon moi dans un premier temps contenté de ne pas référencer la nouvelle page..mettant un certain temps avant de desindexer le fichier se trouvant à cette url...
Ce qui, je l'avoue n'explique pas le fait que t'ais pas de visite à ce moment là, a moins que tu ais spécifié une clause concernant cette page dans ton robots.txt ...?
 
WRInaute accro
Toutou-Fr a dit:
Ce qui, je l'avoue n'explique pas le fait que t'ais pas de visite à ce moment là, a moins que tu ais spécifié une clause concernant cette page dans ton robots.txt ...?
Merci pour ta réponse. Il n'y a rien concernant cette page dans le robots.txt. Et, le même jour, le fichier log indique des visites de Googlebot à d'autres pages du site.

Je n'y comprends rien. En fait, tout se passe comme si, le 12 décembre, Googlebot avait lu la page ailleurs que sur mon site (version d'avant le 26 novembre "mise en cache quelque part").

Jean-Luc
 
Discussions similaires
Haut