D'ou viennent ces 404

WRInaute discret
Bonjour,

voilà dans gwt j'ai quelques erreurs d'explorations mais impossible de savoir d'où elles viennent, j'ai essayer avec screaming frog il me dit que tout ok. Donc si vous avez une petite idée d'où ça peut venir:


merci de votre aide.
 
Membre Honoré
Bonjour,

Tout simplement, vérifier les informations avec l'outil qui indique les erreurs.
Cf. l'aide de l'outil de Google.

Cordialement.
 
WRInaute discret
Bonjour,

le soucis c'est que soit c'est pas marqué sur quoi elles sont référencés, soit c'est marqué sur le site, mais c'est faux, je ne génère pas d'url de ce type... j'ai donc du mal à comprendre d'où elles viennent?
 
WRInaute passionné
Parfois GG il pédale dans la semoule ou il s'excite sur un bug d'un référer qui depuis a corrigé.

Du sélectionne tout et tu dis "Corrigé".
... et tu surveilles au cas où elle reviennent.
 
WRInaute discret
Bonjour,
dès le lendemain nouvelle url en erreur du même type -http://www.champagne-arnaud-beaufort-fils.fr/816361681/222094546/xiti/000106229593::presentation_Champagne%20Arnaud%20Beaufort%20et%20Fils?r=
une seule par contre pour l'instant et bien sur il ne me dit pas où il l'a trouvé...
une piste? ou tant pis pour les urls de ce type?
Merci.
 
WRInaute passionné
Slt,

Tiens : https://www.google.fr/?gfe_rd=ssl&ei=kDkPV_i7M9eFaKWQn7gK#q=site:www.c ... i&filter=0

GG il cherche des pages parce qu'il les connait.
S'il les connais, c'est pour 2 choses.
1 - il trouve un BL.
2 - il l'a déjà dans son index.

Bah pour toi, y a du y avoir une grosse coquille pour qu'il index tout un tas de "fausses" pages qui à ce moment lui fournissaient un contenu non "404".
Maintenant, il retourne les voir.

Donc... maintenant qu'elles pointent en 404, il ne les prendra plus en compte.
Et dans la console, ... "corrigé". ;-)
 
WRInaute discret
Bonjour,
merci pour la réponse,
1 - Non il n'y a pas de BL c'est sur.
2 - c'est possible effectivement, avant le site a été fait, et tenu par les pages jaunes ça ne m'étonnerais pas du tout de leur part, donc en fait google retourne voir ces pages, juste parce qu'ils les a déjà eu dans son index, donc si je comprends bien je marque corrigé jusqu'à ce qu'il arrête.

Merci.
 
WRInaute discret
Bonjour,

j'ai finalement trouvé d'où viennent ces erreurs, en explorant mes logs,
j'ai pas mal de lignes de ce genre:
5.9.111.70 [18/Apr/2016:01:53:27 +0200] "GET /816361681/259562690/estat/?l2=(PVI)MEDIA&l3=PHOTOS&l4=PHOTOS&lang=FR&r= HTTP/1.1" 404 9290 "-" "Mozilla/5.0 (compatible; MJ12bot/v1.4.5; http://www.majestic12.co.uk/bot.php?+)"

je voudrais donc savoir quel est la meilleure chose à faire, laissez comme ça en continuant de supprimer dans la console google? , bloquer le bot? , le site?

merci d'avance pour vos réponses
 
Discussions similaires
Haut