blocage du crawl sur une page que faire ?

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

Yvel
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 428
Inscription: 5 Juin 2005

blocage du crawl sur une page que faire ?

Message le Dim Juil 17, 2005 12:33

bonjour,

sur le site de mon profil, le crawl gglbot bloque sur une page (carre.html). il passe chaque jour et s'arrete à cette page puis houpppsss s'en va. cette page est toujours en deuxième ligne de crawl donc il ne va pas plus loin.

a noter que j'ai mis un sitemaps.xml.gz qui semble avoir fonctionné il y a 2 semaines puisque le nombre de pages indexées représente la quasi totalité du site.
Mais depuis, blocage sité plus haut.
je modifie mon sitemaps à chaque mise à jour du site.
dans mes log, j'ai chaque jour un get sitemaps avec un code retour 200 qui, si j'ai bien compris, indique que tout est ok pour le sitemaps.

quelqu'un pourrait m'aider à comprendre pourquoi ce blocage sur la page carre.html ?

Startide
WRInaute discret
WRInaute discret
 
Messages: 158
Inscription: 11 Juil 2005

Message le Dim Juil 17, 2005 13:18

Bien que très jolies, cette page fonctionne à base de javascript, ce qui risque de ne pas inspirer google :/

Essaie un tag <noscript> </noscript> pour placer les liens ?

J'ignores si cela vient de ca, et si noscript peut aider.

Mais je pense que dans la mesure où ton site est bien crawlé, et que spécifiquement cette page ne l'est pas.. c'est qu'il doit y avoir une relation avec ce javascript.

Yvel
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 428
Inscription: 5 Juin 2005

Message le Dim Juil 17, 2005 13:37

ce qui m'intrigue c'est le fait que le crawl commence systematiquement par cette page carre.html et qu'apres plus rien.
la page carre.html est bien crawlée elle.

ce lien ne figure pas en début de code.
en revanche il figure haut dans l'affichage de la page dans le navigateur.

mais je vais voir du coté du tag /noscript, selon ton conseil

Startide
WRInaute discret
WRInaute discret
 
Messages: 158
Inscription: 11 Juil 2005

Message le Dim Juil 17, 2005 13:40

Et c'est la seule qui est crawlée ? Oo c'est surprenant ca.

Quand tu dis qu'elle est "haut" c'est le premier lien rencontré ?

Essaie, si tu peux, de la remplacer par une page plus classique, vu que google semble l'aimer...

Yvel
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 428
Inscription: 5 Juin 2005

Message le Dim Juil 17, 2005 13:49

oui, je vais essayer une autre configuration de la page, voir si GGL change son habitude.

Yvel
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 428
Inscription: 5 Juin 2005

Message le Lun Juil 18, 2005 0:06

bon ok.... ça crawl sec là. c'est bon. je crois avoir compris le problème. ça ne vient pas de la page index mais de carre.html qui ne comporte que des liens sur images et un retour sur l'index par un lien sur rollover. à mon avis, le bot ne doit pas pouvoir sortir de là donc un petit tour et s'en va.
mais je récupère le crawl sur les pages d'un niveau inférieur avec le sitemaps.


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité