Crawl de pages qui n'existent plus et forcément erreurs GWT :/
2 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- julien-h92
- Nouveau WRInaute

- Messages: 21
- Inscription: 19 Nov 2008
Crawl de pages qui n'existent plus et forcément erreurs GWT :/
Vous l'aurez compris en lisant le titre, il m'arrive quelque chose de très étrange depuis quelques temps.. Je travaille (ou plutôt je fais semblant ^^) sous Wordpress est alors que j'ai bien supprimé 5 ou 6 articles de mon blog depuis plus de quinze jours, Google Bot (et Yahoo bot) me crawlent ces pages malgré tout. Du coup chaque jour, GWT m'indique que ces pages remontent des erreurs 404 et qu'elles sont introuvables (nan, sérieux ?? pff..)
Je suis en train de devenir fou car j'ai bien vérifié et ces articles n'existent plus (ni les tags en question d'ailleurs..) alors j'ai essayé de les supprimer de l'index de Google dans GWT mais pour la majorité, j'obtiens un refus de suppression. Du coup dans l'immédiat je gère en redirection 301 grâce à un plugin Wordpress (jsuis trop bidon pour le faire en .htaccess, j'y pige rien), mais c'est n'importe quoi je vous l'accorde.
Autre fantaisie, GWT m'a indexé une page qui n'existe pas et n'a JAMAIS existé, en se plantant de surcroit dans l'URL, il m'indexe une de mes pages ainsi :
http://monsite.com/sujet-de-mon-article/Une%20supportrice%20sud%20afri ... 20endommagé%20la%20gorge%20à20force%20de%20souffler%20dans%20l'instrument.%20Ce%20qui%20au%20départ%20n'était%20apparemment%20qu'un%20simple%20mal%20de%20gorge,%20s'est%20avéré%20en%20fait%20être%20une%20lésion%20de%20la%20trachée.
Et une autre en :
http://monsite.com/western-digital-hotliner-alcoolique/www.viedemerde.fr/ (j'ai mis un lien vers ce site dans mon article, mais pas dans mon url jsuis nul mais pas à ce point..)
Question :
1. Comment se fait il que des articles qui sont censés ne plus exister et qui ne sont ni dans mon sitemap.xml, ni dans mon sitemap.xml.gz se retrouve SANS CESSE et a chaque passage de GG crawlés et indexés ????
2. Physiquement, sont ils présents dans un de mes dossiers sur mon ftp ? (je sais la question est débile mais un article wordpress lorsqu'il est publié est il créé dans un dossier et du coup il est possible qu'en le supprimant de mes articles il ne le soit pas forcément physiquement de mon ftp ?) < j ai regardé vite fait je trouve pas de dossiers comportant mes aricles mais j ai peut être mal cherché..
3. je prends tous les conseils que vous me donnerez je suis une quiche absolue en referencement et Google me déteste..
MERCI D AVANCE AUX BONNES AMES QUI M AIDERONT (parceque je suis a 2 doigts de peter un cable.
Pour info mon site est accessible via "http://lahyene.com" si quelqu'un veut regarder le code de la page ou autre..les plugins installés sont "XML Sitemap", "All in One SEO Plugin" pour le référencement principalement.
Je suis en train de devenir fou car j'ai bien vérifié et ces articles n'existent plus (ni les tags en question d'ailleurs..) alors j'ai essayé de les supprimer de l'index de Google dans GWT mais pour la majorité, j'obtiens un refus de suppression. Du coup dans l'immédiat je gère en redirection 301 grâce à un plugin Wordpress (jsuis trop bidon pour le faire en .htaccess, j'y pige rien), mais c'est n'importe quoi je vous l'accorde.
Autre fantaisie, GWT m'a indexé une page qui n'existe pas et n'a JAMAIS existé, en se plantant de surcroit dans l'URL, il m'indexe une de mes pages ainsi :
http://monsite.com/sujet-de-mon-article/Une%20supportrice%20sud%20afri ... 20endommagé%20la%20gorge%20à20force%20de%20souffler%20dans%20l'instrument.%20Ce%20qui%20au%20départ%20n'était%20apparemment%20qu'un%20simple%20mal%20de%20gorge,%20s'est%20avéré%20en%20fait%20être%20une%20lésion%20de%20la%20trachée.
Et une autre en :
http://monsite.com/western-digital-hotliner-alcoolique/www.viedemerde.fr/ (j'ai mis un lien vers ce site dans mon article, mais pas dans mon url jsuis nul mais pas à ce point..)
Question :
1. Comment se fait il que des articles qui sont censés ne plus exister et qui ne sont ni dans mon sitemap.xml, ni dans mon sitemap.xml.gz se retrouve SANS CESSE et a chaque passage de GG crawlés et indexés ????
2. Physiquement, sont ils présents dans un de mes dossiers sur mon ftp ? (je sais la question est débile mais un article wordpress lorsqu'il est publié est il créé dans un dossier et du coup il est possible qu'en le supprimant de mes articles il ne le soit pas forcément physiquement de mon ftp ?) < j ai regardé vite fait je trouve pas de dossiers comportant mes aricles mais j ai peut être mal cherché..
3. je prends tous les conseils que vous me donnerez je suis une quiche absolue en referencement et Google me déteste..
MERCI D AVANCE AUX BONNES AMES QUI M AIDERONT (parceque je suis a 2 doigts de peter un cable.
Pour info mon site est accessible via "http://lahyene.com" si quelqu'un veut regarder le code de la page ou autre..les plugins installés sont "XML Sitemap", "All in One SEO Plugin" pour le référencement principalement.
- Rod la Kox
- WRInaute accro

- Messages: 3253
- Inscription: 24 Juin 2008
Re: Crawl de pages qui n'existent plus et forcément erreurs GWT :/
Tout d'abord, techniquement parlant, Google ne peut crawler une page qui n'existe pas, il trouve un lien pointant vers elle est tente d'y accéder, nuance.
En ce qui concerne les pages en 404, il faut voir si tous les liens pointant vers elles ont été supprimé (interne, mais aussi externe).
Pour ce qui est de la suppression d'une page via les GWT, ça fonctionne. Mais encore faut-il suivre leur directive, à savoir de mettre l'url dans le robots.txt, etc...
Rediriger une page inexistante vers une autre via une 301 n'est en rien bidon. C'est une solution pour dire à GG que l'ancienne n'existe plus et qu'il doivent transposer tout ce qu'il savait sur elle vers la nouvelle.
En ce qui concerne les pages en 404, il faut voir si tous les liens pointant vers elles ont été supprimé (interne, mais aussi externe).
Pour ce qui est de la suppression d'une page via les GWT, ça fonctionne. Mais encore faut-il suivre leur directive, à savoir de mettre l'url dans le robots.txt, etc...
Rediriger une page inexistante vers une autre via une 301 n'est en rien bidon. C'est une solution pour dire à GG que l'ancienne n'existe plus et qu'il doivent transposer tout ce qu'il savait sur elle vers la nouvelle.
2 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- GWT : Erreurs d'exploration
- Erreurs dans GWT
- Erreurs SOFT 404 sur GWT
- Solution aux crawl errors dans GWT
- GWT : Nombreuses erreurs d'exploration (pourtant corrigées)
- Sitemag.xml.gz genere Erreurs 404 (crawl errors)
- fichier robots.txt : erreurs d'analyse dans GWT
- Erreurs d'exploration dans GWT avec undefined en fin d'url
- Erreurs 500 pour le Googlebot et dans GWT, mais site accessible
- Cannot instantiate non-existent class
- Nouveaux rapports d'erreur de crawl dans Google Webmaster Tools
- Google Web Toolkit peut créer des applications pour iPhone
- Google Webmaster Tools alerte en cas de pb de duplicate content
- Google Actualités crawle désormais avec le Googlebot classique
- Le Full Crawl a enfin commencé
- Gestion des droits d'accès dans Google Webmaster Tools
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
