Gestion 404 des url "texte" issus de sites

Nouveau WRInaute
Salut,

Comment gérez vous les multiple 404 "texte" issus de sites tiers ?

Je m'explique.

Via les GWT, je vois mes 404.
Celles venant de mon site (y en a jamais:))
Celles venant de sites tiers qui ont un lien avec une faute de frappe.

... celles qui m’intéressent là et qui sont en fait des url pure texte intégrées à un contenu textuel.
Elles sont non cliquable, mais GG les voit et les prend en compte dans mes 404.

Or, généralement, ces url texte viennent de sites "pollueurs" comme des annuaires, des moteurs de recherches, des analyseur SEO, etc... qui affiche dans leur page une url en texte et bien sur, celle-ci est généralement tronquée.

Exemple :
page OK : http://www.example.com/toto/une-histoire-de-toto.php
url en défaut : http://www.example.com/toto/une-histoire-de-tot...

Merci pour vos info/conseils
 
Nouveau WRInaute
Ca change quoi example.com ou ndd.tld ?
Rien vu que cela n'envoie aucun lien vers personne. ;-)


Bref.

Autre question toute bête qui me vient à l'esprit au vu de ce problème de 404 "textuel".
Pourquoi gg continu à indexer les résultats de moteurs de recherche ?
Quel pourrait en être l'intérêt ?
 
WRInaute accro
example.com est un nom de domaine qui existe et qui est spécifiquement fait (comme ses petits copains example.org , example.net) pour les exemples.

ça évite à WRI d'envoyer des 404 dans la nature (google aime pas) ou des liens vers des sites totalement "autres" parce qu'un petit malin a racheté un site avec un nom de domaine de beaucoup de gens utilisent.

Donc si l'exemple est dans le texte, sans aucun lien, même ajouté automatiquement , ndd.tld ne pose pas de problème, mais comme le forum a tendance a rajouter un lien dès qu'il voit un truc qui ressemble à une url, autant prendre l'habitude d'utiliser example.com

Bref (enfin pas si bref, mais bon)

Sinon Google n'indexe pas les résultats des moteurs de recherche. Il indexe les listes d'urls qui sont présentées sur les résultats de recherche dans des sites. Il demande d'ailleurs expréssement à ce que les résultats de recherche (de vraie recherche, notamment sur Google) ne soient pas indexés.
 
WRInaute passionné
C'est clair que le nombre de 404 a augmenté ces dernier temps avec des url au format texte. La faute en grande partie a des pseudo moteurs de recherche qui indexent leurs résultats. Certains ont même un très grand nombre de ces pages indexées et doivent se porter très bien. Panda et autres filtres ne doivent pas être faits pour eux!
 
Nouveau WRInaute
Marie-Aude a dit:
Sinon Google n'indexe pas les résultats des moteurs de recherche. Il indexe les listes d'urls qui sont présentées sur les résultats de recherche dans des sites.

???
-http://www.junglekey.fr/index.php

Si ça, c'est pas du typique moteur indexé.
Et y en a des tas... je les vois tous dans mes GWT, notamment des .ru, des .pl , asiat'engin...

Donc, en gros, comme GG fait pas sont taf, il faut :

- Bloquer les spiders indésirables.
- Demander le retrait de nos url de ces moteurs.
... c'est pas gagné. :)
 
WRInaute passionné
sauf qu'à mon avis beaucoup de moteurs n'en sont pas. Ils doivent se contenter de récupérer les résultats de yahoo ou d'autres vrais moteurs.
 
Nouveau WRInaute
Ok, alors pourquoi GG ne prend t-il pas en compte leur demande de suppression de son index lorsqu'on le demande ?
 
Discussions similaires
Haut