Messages: 179

Enregistré le: 4 Mar 2006

Message le Lun Mai 14, 2012 8:53

Bonjour,

Google essai d'indexer des pages qui n'existent pas du type :

mondomaine/-1-1170-2.html
mondomaine/-2-2-38,58,e.html
...

comment je peux faire avec le htaccess ou le robot.txt pour lui interdire de les indexer ?

Merci pour votre aide !
Haut
5 Réponses
Messages: 2172

Enregistré le: 30 Oct 2008

Message le Lun Mai 14, 2012 11:26

Si l'url en 404 peut-être redirigée vers la bonne (changement d'adresse, url avec faute de frappe, ...) il vaut mieux le faire. Si ces url se trouvent sur un site et que tu peux récupérer un bon BL tu peux toujours rediriger vers la racine sinon.
Haut
Messages: 179

Enregistré le: 4 Mar 2006

Message le Lun Mai 14, 2012 18:02

non, en fait ces URL sont des "morceaux" de vraies URL ..
Je ne sais pas pourquoi Google indexe des pages qui n'existent pas !!
Haut
Messages: 2172

Enregistré le: 30 Oct 2008

Message le Lun Mai 14, 2012 18:28

il les a trouvées sur des sites pourris (scrapper par exemple). C'est peut-être aussi un bug sur ton site. Tu as normalement la source dans les erreurs d'exploration de GWT.
Haut
Messages: 179

Enregistré le: 4 Mar 2006

Message le Lun Mai 14, 2012 19:08

en fait, ces pages sont référencées sur ma boutique et cela semble venir de la langue Anglais que je n'ai pas activé.
un casse tête quoi !!
Haut
Messages: 179

Enregistré le: 4 Mar 2006

Message le Sam Mai 19, 2012 20:56

si dans robot.txt, je mets :

Disallow: /*-

je n'aurais plus ce type d'url :
http://www.site/-1-917-2-49.html
http://www.site/-1-854-2-7.html

etc ..
Haut