Pourquoi ai-je 2,5 fois plus de pages indexées que d'URL ?

WRInaute occasionnel
Bonjour à toutes et à tous,

Voilà, c'est bien simple : le 5 mars Google search console m'annonce que j'ai 2270 pages indexées. Et pourtant lorsque je regarde sur ma plate-forme WordPress, je n'ai que 90 pages et 797 articles. Mais qu'est-ce que c'est que ce binz ?

Merci d'avance :wink: .
 
Olivier Duffez (admin)
Membre du personnel
il s'agit sans doute de ce que chez Ranking Metrics on appelle la masse noire
lance un outil de crawl sur ton site et tu auras sans doute la réponse
 
WRInaute occasionnel
WebRankInfo a dit:
il s'agit sans doute de ce que chez Ranking Metrics on appelle la masse noire
lance un outil de crawl sur ton site et tu auras sans doute la réponse

Je viens de lancer MRT, qui me retourne 39 % de pages non-indexables car "URL canonique fournie (différente de l'URL crawlée)". En regardant de plus près, il s'agit de différences entre http et https.

Par exemple, celle ci http://www.emprunter-malin.com/taux-immobiliers/ existe en double avec celle-ci https://www.emprunter-malin.com/taux-immobiliers/.

Et pourtant mon développeur a fait la redirection http https. Par exemple, celle de mon index http://www.emprunter-malin.com/ pointe bien vers http://www.emprunter-malin.com/. C'est là où je ne comprends plus rien, je croyais que toutes les URL en http étaient dirigées vers https. 8O.
 
WRInaute occasionnel
Bon, entre mon message précédent et maintenant, j'ai pu joindre mon développeur qui s'est aperçu que la redirection https avait sauté… Et maintenant, c'est réparé.

Par contre, ça n'explique toujours pas pourquoi je 2 fois plus d'URL indexées…

J'ai plus qu'à repasser un autre crawl sur MRT pour tenter d'identifier ce problème de masse noire....
 
WRInaute occasionnel
Me revoici avec les derniers résultats du crawl MRT, qui dit :

si votre nombre de pages à indexer est égal à 888, alors vous n'avez aucun problème.

Nb de pages indexables 888.

Dois-je en conclure que je n'ai pas de problème avec cette fameuse masse noire ?

Merci d'avance pour votre aide, tous ces trucs techniques qu'on ne comprend pas et sur lesquels on ne peut pas agir, c'est très stressant. :evil:
 
WRInaute accro
Penses aussi que tu as tes pages de pagination qui sont indexées. Ça augmente de facto le volume de tes pages.
 
WRInaute occasionnel
UsagiYojimbo a dit:
Ça augmente de facto le volume de tes pages.

Ça fait quand même 2 fois plus. Et surtout, c'est l'analyse du nouveau compte créé sur GSA, spécialement pour la nouvelle URL en https. Ça voudrait dire que dès sa première indexation, il me donne autant de pages de pagination (t'as remarqué, je fais comme si je savais ce que c'était qu'une page de pagination :D ) que d'URL ?
 
WRInaute occasionnel
UsagiYojimbo a dit:
Tu en a quand même 423

OK, admettons. Donc GSA devrait m'indexer environ 1700 pages, au lieu de 2200… Et puis tiens d'ailleurs, je me rends compte que décidément je ne sais même pas ce que sont ces page de pages de pagination. Encore un truc qui vient compliquer les choses. :|
 
WRInaute accro
Bein, sur Wordpress, pour les pages de type taxonomie, catégorie, etc, par défaut tu n'as que 10 items par pages (ça peut se changer en backoffice). Après, ça pagine.
 
WRInaute occasionnel
UsagiYojimbo a dit:
Bein, sur Wordpress, pour les pages de type taxonomie, catégorie, etc, par défaut tu n'as que 10 items par pages (ça peut se changer en backoffice). Après, ça pagine.

OK, merci je comprends mieux. Mais le problème est que dès lors qu'une page de catégorie ou de tag contient plus de 10 articles (ou plus selon réglages), WordPress crée automatiquement une autre page. Ça finit par faire beaucoup de pages avec des balises méta en double, surtout quand on rajoute du contenu tous les jours comme moi. Il reste à savoir si ça représente vraiment un problème pour le référencement ?

Et puis il me reste aussi à trouver d'où viennent ces autres pages indexées, et si elles peuvent être un problème pour mon référencement. Car si 1000 pages de pagination sont mal fichues, effectivement ça peut faire pencher la balance du mauvais côté.
 
WRInaute accro
Normalement si tu as un plugin type Yoast d'indexé, il gère ça pas trop mal (activation des balises prev / next). Même si se pose l'intérêt d'indexer ou pas (tout en les laissant crawlables) ce genre de page
 
WRInaute occasionnel
UsagiYojimbo a dit:
Normalement si tu as un plugin type Yoast d'indexé, il gère ça pas trop mal (activation des balises prev / next). Même si se pose l'intérêt d'indexer ou pas (tout en les laissant crawlables) ce genre de page


Hmmmmm. J'ai un yoast tout bête, le gratuit, reste à savoir s'il est bien réglé. Va falloir que je me penche la-dessus...
 
Discussions similaires
Haut