Sitemag.xml.gz genere Erreurs 404 (crawl errors)
11 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- Mag2Mag
- Nouveau WRInaute

- Messages: 17
- Inscription: 14 Juil 2011
Sitemag.xml.gz genere Erreurs 404 (crawl errors)
Bonjour,
Après avoir cherché une solution pendant un mois par moi-même en testant différentes solutions et en parcourant les sujets déjà ouverts ici et là , je me vois obligé de faire un appel "personnalisé" tant mon problème est étrange.
Le contexte :
J'ai un site qui tourne sous wordpress
J'ai le plugin Google XML SiteMaps installé
ma structure de permaliens est domaine.fr/categorie/nom-de-la-page-id
Le problème :
Dans Google Webmaster Tools (GWT) j'ai des centaines d'erreurs de crawl (not found - 404) de pages qui n'existent pas et que GWT me dit trouver dans mon sitemap.xml.gz. Pour quelques erreurs il me dit aussi que la source n'est pas disponible (unavailable).
Les pages "not found" correspondent à mes articles (posts wordpress) et l'adresse trouvée par GWT a pour structure : domaine.fr/nom-de-la-page-id. En gros GWT me zappe le "categorie" de ma structure.
Exemple : au lieu de me crawler normalement domaine.fr/legumes/carotte-3456 il me trouve une erreur de crawling sur domaine.fr/carotte-3456 (sans la catégorie legumes donc)
Pourtant les articles sont indexés correctement dans google quand je fais une recherche.
Solution :
J'ai vérifié le contenu de mon sitemap.xml.gz et ces pages not found crawlées par googlebot que GWT me dit trouvé dans mon sitemap n'y sont pourtant pas !
J'ai recréé mille fois mon sitemap.xml.gz et rien n'y fait il continue à me trouver ces pages qui n'existent nulle part (j'ai même tapé les urls dans google pour voir si un site linkait vers elles mais zéro résultat).
Au début j'ai pensé que l'erreur venait du plugin WP Super Cache mais j'ai supprimé ce plugin et ça n'a eu aucun effet
J'ai ensuite pensé que l'erreur venait d'un test sur mes permaliens (j'avais essayé d'enlever la catégorie pour avoir justement seulement domaine.fr/nom-de-la-page mais j'étais finalement revenu en arrière) mais impossible de savoir si c'est ça...
Aujourd'hui j'ai l'impression de n'avoir que deux choix :
faire un Disallow sur toutes ces pages dans un robot.txt (je n'en ai pas à l'heure actuelle)
faire des redirections 301
Mes ces deux solutions me semblent être du bricolage un peu hasardeux.
Pouvez-vous m'aider à régler ce problème, ça devient urgent, j'ai remarqué une baisse de mon positionnement dans les recherches google (pas énorme mais quand meme)...
Merci !
Après avoir cherché une solution pendant un mois par moi-même en testant différentes solutions et en parcourant les sujets déjà ouverts ici et là , je me vois obligé de faire un appel "personnalisé" tant mon problème est étrange.
Le contexte :
J'ai un site qui tourne sous wordpress
J'ai le plugin Google XML SiteMaps installé
ma structure de permaliens est domaine.fr/categorie/nom-de-la-page-id
Le problème :
Dans Google Webmaster Tools (GWT) j'ai des centaines d'erreurs de crawl (not found - 404) de pages qui n'existent pas et que GWT me dit trouver dans mon sitemap.xml.gz. Pour quelques erreurs il me dit aussi que la source n'est pas disponible (unavailable).
Les pages "not found" correspondent à mes articles (posts wordpress) et l'adresse trouvée par GWT a pour structure : domaine.fr/nom-de-la-page-id. En gros GWT me zappe le "categorie" de ma structure.
Exemple : au lieu de me crawler normalement domaine.fr/legumes/carotte-3456 il me trouve une erreur de crawling sur domaine.fr/carotte-3456 (sans la catégorie legumes donc)
Pourtant les articles sont indexés correctement dans google quand je fais une recherche.
Solution :
J'ai vérifié le contenu de mon sitemap.xml.gz et ces pages not found crawlées par googlebot que GWT me dit trouvé dans mon sitemap n'y sont pourtant pas !
J'ai recréé mille fois mon sitemap.xml.gz et rien n'y fait il continue à me trouver ces pages qui n'existent nulle part (j'ai même tapé les urls dans google pour voir si un site linkait vers elles mais zéro résultat).
Au début j'ai pensé que l'erreur venait du plugin WP Super Cache mais j'ai supprimé ce plugin et ça n'a eu aucun effet
J'ai ensuite pensé que l'erreur venait d'un test sur mes permaliens (j'avais essayé d'enlever la catégorie pour avoir justement seulement domaine.fr/nom-de-la-page mais j'étais finalement revenu en arrière) mais impossible de savoir si c'est ça...
Aujourd'hui j'ai l'impression de n'avoir que deux choix :
faire un Disallow sur toutes ces pages dans un robot.txt (je n'en ai pas à l'heure actuelle)
faire des redirections 301
Mes ces deux solutions me semblent être du bricolage un peu hasardeux.
Pouvez-vous m'aider à régler ce problème, ça devient urgent, j'ai remarqué une baisse de mon positionnement dans les recherches google (pas énorme mais quand meme)...
Merci !
-

Marie-Aude - Modérateur

- Messages: 11900
- Inscription: 5 Juin 2006
Re: Sitemag.xml.gz genere Erreurs 404 (crawl errors)
Mag2Mag a écrit:J'ai ensuite pensé que l'erreur venait d'un test sur mes permaliens (j'avais essayé d'enlever la catégorie pour avoir justement seulement domaine.fr/nom-de-la-page mais j'étais finalement revenu en arrière) mais impossible de savoir si c'est ça...
ça doit pourtant être la source.
tu as resoumis manuellement ton sitemap ?
Sinon utilise le plugin redirection pour rediriger cette "ancienne" structure de permaliens vers la nouvelle
- Mag2Mag
- Nouveau WRInaute

- Messages: 17
- Inscription: 14 Juil 2011
Re: Sitemag.xml.gz genere Erreurs 404 (crawl errors)
Oui, j'ai resoumis manuellement mon sitemap à plusieurs reprises depuis que j'avais tenté cette modification. Et surtout comme je le dis c'est que quand je regarde le contenu du sitemap les liens sont corrects...
Pour le plugin, c'est une solution effectivement mais je crains que ça ne règle pas véritablement le problème.
Merci pour cette réponse.
Pour le plugin, c'est une solution effectivement mais je crains que ça ne règle pas véritablement le problème.
Merci pour cette réponse.
-

Marie-Aude - Modérateur

- Messages: 11900
- Inscription: 5 Juin 2006
Re: Sitemag.xml.gz genere Erreurs 404 (crawl errors)
Si ça la règlera, puisque les urls seront correctement redirigées, il n'y aura plus de 404
- Mag2Mag
- Nouveau WRInaute

- Messages: 17
- Inscription: 14 Juil 2011
Re: Sitemag.xml.gz genere Erreurs 404 (crawl errors)
Bonsoir,
Comme je le craignais, la solution du plugin ne résout pas le problème. Il corrige à posteriori les erreurs détectées mais de "fausses url" continuent d'être détectées avec une source "unavailable". Le plugin est donc ok pour agir après, mais j'aimerais surtout réparer le pb pour en finir une bonne fois pour toute avec ça et ne pas avoir à faire une redirection 301 à chaque fois.
Il semblerait que le pb date du 10 juin et que tous les articles écrits avant cette date connaissent le même problème... Ainsi, régulièrement GWT me sort une fausse url sur des articles écrits avant cette date (encore aujourd'hui par exemple...).
Comme je le craignais, la solution du plugin ne résout pas le problème. Il corrige à posteriori les erreurs détectées mais de "fausses url" continuent d'être détectées avec une source "unavailable". Le plugin est donc ok pour agir après, mais j'aimerais surtout réparer le pb pour en finir une bonne fois pour toute avec ça et ne pas avoir à faire une redirection 301 à chaque fois.
Il semblerait que le pb date du 10 juin et que tous les articles écrits avant cette date connaissent le même problème... Ainsi, régulièrement GWT me sort une fausse url sur des articles écrits avant cette date (encore aujourd'hui par exemple...).
-

Marie-Aude - Modérateur

- Messages: 11900
- Inscription: 5 Juin 2006
Re: Sitemag.xml.gz genere Erreurs 404 (crawl errors)
Non elles ne continuent pas à être détectées, c'est simplement que la mise à jour de cette information est assez longue...
- Mag2Mag
- Nouveau WRInaute

- Messages: 17
- Inscription: 14 Juil 2011
Re: Sitemag.xml.gz genere Erreurs 404 (crawl errors)
Bonjour,
Je reviens pour faire le point et conclure ce sujet.
Suite à l'installation du plugin de redirection 301 qui m'a été suggéré par Marie-Aude, je constate en effet une diminution, lente mais réelle, du nombre d'erreurs 404.
Je suis ainsi passé de 250 erreurs à 175 aujourd'hui. Les choses semblent donc revenir dans l'ordre petit à petit.
Merci Marie-Aude.
Je reviens pour faire le point et conclure ce sujet.
Suite à l'installation du plugin de redirection 301 qui m'a été suggéré par Marie-Aude, je constate en effet une diminution, lente mais réelle, du nombre d'erreurs 404.
Je suis ainsi passé de 250 erreurs à 175 aujourd'hui. Les choses semblent donc revenir dans l'ordre petit à petit.
Merci Marie-Aude.
-

Marie-Aude - Modérateur

- Messages: 11900
- Inscription: 5 Juin 2006
Re: Sitemag.xml.gz genere Erreurs 404 (crawl errors)
Merci 
-

Marie-Aude - Modérateur

- Messages: 11900
- Inscription: 5 Juin 2006
Re: Sitemag.xml.gz genere Erreurs 404 (crawl errors)
Parce que la mise à jour dans GWT est très lente
11 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Yahoo me génère des erreurs 404! Help!
- Solution aux crawl errors dans GWT
- Soft 404 : Google détecte les erreurs 404 qui n'en sont pas
- Adsense me génère des erreurs Javascript !
- Problème XML / RSS généré en PHP
- [résolu] 404 en htaccess génère un 302...
- envoyer une erreur 404 apres avoir généré le header
- Crawl de pages qui n'existent plus et forcément erreurs GWT :/
- Htacces et erreurs 404
- erreurs 404 et déclassement
- Nouveaux rapports d'erreur de crawl dans Google Webmaster Tools
- Le Full Crawl a enfin commencé
- Soft 404 : les pages d'erreurs avec un code HTTP 200
- Nombreuses erreurs 404 : impact sur le référencement
- Quelques exemples d'amélioration de Bing Search
- Google Actualités crawle désormais avec le Googlebot classique
- Un moyen très simple et gratuit d'obtenir des backlinks
- Google Enterprise a son blog
Consultez la description détaillée des produits ou services de Google suivants : API Google Checkout
- Analyse de l'entête HTTP
Cet outil vous permet de connaître le code HTTP renvoyé par le serveur pour une page donnée.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

