Erreurs 404 imaginaires d'exploration dans GWT ?

WRInaute discret
Salut à tous !

Depuis quelques semaines maintenant, GG me trouve X erreurs d'explo par jour/deux jours. Je sais bien qu'elles ne sont pas imaginaires et qu'elles doivent provenir d'un endroit mais je ne trouve pas.

Elles ciblent les tags, et plus particulièrement certains tags qui semblent générés à mon insu:

Voici l'exemple du jour:

  • tag/vertebre/besoin-dun-truc
    tag/animal/besoin-dun-truc
    tag/chameau/besoin-dun-truc
    tag/homo-sapiens-sapiens/besoin-dun-truc

C'est TOUJOURS la même structure: ça part d'un tag aléatoire, auquel est rajouté l'adresse de ma page /besoin-dun-truc.

Premier réflex, me dire que j'avais oublié dans mon menu, par exemple, un / avant /besoin-dun-truc ce qui aurait pu avoir pour conséquence étrange de bugger les tags. Mais ce n'est pas le cas :/
D'ailleurs, je n'utilise plus ces tags depuis un bout de temps et ils ont été supprimés...

Dois-je simplement "supprimer" les 5-10 url chaque jour via GWT ou quelque chose peut être entrepris dans le code pour éviter ce bug quotidien ? De plus, y aurait-il quelque chose de particulier à faire pour éviter que la page /besoin-dun-truc se retrouve collée aux tags inexistants ?

Un énorme merci !
 
WRInaute passionné
Bonjour,

j'ai connu cela aussi, et d'autres. Dans mon cas sur des millions d'urls, j'ai du au final changer la structure de mon site.
Il y avait bien une erreur de Google, mais cela pouvait être aussi du NSEO, je n'ai pas trouvé la cause. Je pense qu'il s'agit d'un algo un peu foireux de Google qui tente de déceler des urls dans du texte sur des pages ...

Il faut déjà examiner en profondeur les LOGS, et voir ce qu'il se passe dans le crawl de Google.
Ensuite, le mieux est de faire une synthese et mettre en place une stratégie de redirection 301, si c'est possible.
 
WRInaute discret
Merci pour ta réponse !

Wow ça a l'air plus complexe que je n'imaginais... comment puis-je accéder à ces logs ?

Si je demande à google de supprimer les url /tag/ de mon site, cela résoudra-t-il le souci lorsqu'il réindexera les tags ?
 
WRInaute passionné
il faut aller voir dans l'administration de ton hébergement. Tous ne permettent pas cette option de récupérer les logs.
Non, supprimer les erreurs dans webmastertools n'empeche pas leur réapparition, hélas.
Il faut en trouver la source, peut etre des séparateurs / qui trainent sur les pages?

Sinon, il faut lister ces erreurs 404 et faire les redirections appropriées.
 
WRInaute accro
JeRetiens a dit:
C'est TOUJOURS la même structure: ça part d'un tag aléatoire, auquel est rajouté l'adresse de ma page /besoin-dun-truc.

Si c'est toujours la même structure, tu peux probablement aisément créer une règle de redirection (en 301 de préférence) vers la bonne page ;)
 
WRInaute discret
Si c'est toujours la même structure, tu peux probablement aisément créer une règle de redirection (en 301 de préférence) vers la bonne page ;)

Le souci c'est qu'il n'y a pas réellement de bonne page...

Je suis allé voir les logs, je n'ai pas compris grand chose :/

Est-ce que ces erreurs peuvent nuire à mon référencement (en admettant que je m'amuse à les supprimer manuellement tous les jours/semaines) ?
 
WRInaute accro
Il y a toujours une "bonne page" ;)

:arrow: soit c'est la page du tag (tag/vertebre/besoin-dun-truc --301--> tag/vertebre/) si /vertebre/ existe
:arrow: soit c'est la page "tags" (tag/vertebre/besoin-dun-truc --301--> tag/) si /vertebre n'existe pas et que /tag/ est une page valide
:arrow: soit c'est la home
 
WRInaute passionné
Dans les logs, avec un editeur de texte, tu peut extraire les lignes qui t'intéresse.
Les erreurs sont noté 404 dans les lignes. Tu peux ensuite extraire des 404 celles de google (googlebot dans la ligne).
Tu verra ainsi les fausses pages que google tente de crawler et que tu retrouvera dans webmasterstools, plus tard, et créer les redirections.

Ca semble ardu au début, mais peu a peu, tu t'y retrouvera.
 
Olivier Duffez (admin)
Membre du personnel
c'est sur quel site ?

tu devrais t'assurer qu'il n'y a sur ton site pas le moindre lien vers des URL de ce genre (à ta place c'est ce que je vérifierais en faisant un audit technique avec mon outil)

Google ne t'indique aucune source (lien externe) ? regarde aussi dans tes backlinks

si les tags ont été supprimés de ton site, tu peux simplement bloquer le crawl de /tag/, tu n'auras plus d'erreurs indiquées dans GWT( mais le nb d'URL bloquées augmentera)
 
WRInaute discret
Merci pour vos différentes réponses, je commence doucement à mieux comprendre !

Le site est mon site perso, indiqué dans mon profil, jeretiens.net mais je n'ai pas les moyens financiers de me payer un audit :cry:

Je songe à complètement bloquer l'indexation de mes tags à GG, genre bloquer le crawl et les passer en no index.
Je n'ai franchement pas l'impression qu'ils agissent positivement pour mon référencement (je crois que j'ai du avoir 1 ou 2 clics grâce à ça...) et j'ai l'impression que ça créé du DC (?)

C'est peut-être un peu radical comme solution mais pensez-vous que ça puisse nuire à mes positions dument acquises auprès de GG ?
 
WRInaute passionné
La seule chose qui puisse etre négative aux yeux de google, c'est qu'il considère que tu as des liens morts interne.
Pour ma part, j'ai eut une baisse légère, mais régulière, sans pouvoir contrer et stopper le phénomène assez fou. J'ai réagit assez vite en changeant ma structure, mais ce n'est pas obligé d'en arriver là.

Avec de bonnes et propres redirections, tu ne devrais pas perdre de trafic ni de position. Le DC interne n'est pas sanctionné par Google, une seule des deux pages est sélectionné, c'est tout, il me semble en tout cas.

Je le répete, les liens morts sont sanctionné. Si des pages sont supprimées et que les liens internes aussi, il n'y a pas de sanction. Si les mauvais liens interne restent, là il y aura une sanction.
 
WRInaute discret
Je pense savoir comment sont apparus ces liens bizarres... c'est depuis que j'ai tout simplement supprimé des tags inutiles quand j'en mettais le plus possible par article. Depuis, j'ai réédité une grosse partie du site pour enrichir le contenu et j'en ai profité pour virer quelques tags et c'est à partir de là que GG en repassant sur le site chaque jour bug les résultats...
Le truc c'est que ces liens n'ont jamais existé (les liens complets) donc ils ne sont pas présents matériellement ou réellement dans le site quand GG passe pour indexer !
 
WRInaute impliqué
sur -http://jeretiens.net/tag/vertebre/
il y a bien un lien vers
-http://jeretiens.net/tag/vertebre/besoin-dun-truc
pareil sur -http://jeretiens.net/tag/animal/
donc sur tous les tags supprimés.
 
WRInaute discret
Wow effectivement bien vu et merci à vous deux !

Il ne me reste plus qu'à trouver le fichier fourbe dans lequel j'ai glissé ce lien parce que bien évidemment ce n'est pas 404.php ... ! :lol: C'eut été trop facile !
 
Discussions similaires
Haut