Messages: 2

Enregistré le: 30 Juil 2015

Message le Ven Juin 02, 2017 9:40

Bonjour,

Sur mon site j'ai beaucoup de pages de type :
Code: Tout sélectionner
https://www.monsite.fr/page.html?code=82&idpartenaire=60876


Ne souhaitant pas que Google les indexe, j'ai placé dans mon robots.txt la ligne :
Code: Tout sélectionner
Disallow:/page.html

Mais Google les indexe quand même ... !

Ma syntaxe est-elle mauvaise ?
Devrais-je plutôt écrire un truc genre
Code: Tout sélectionner
Disallow:/page.html*


Merci de votre aide
Haut
3 Réponses
Messages: 329

Enregistré le: 24 Juil 2004

Message le Ven Juin 02, 2017 9:44

Hello,

Je pense plutôt ainsi

Disallow: /page*

http://robots-txt.com/ressources/robots-txt-wildcard/

A+
Yule
Haut
Messages: 3286

Enregistré le: 3 Mai 2004

Message le Ven Juin 02, 2017 12:05

Bonjour,

excellkenza a écrit:Ne souhaitant pas que Google les indexe, j'ai placé dans mon robots.txt la ligne :
Code: Tout sélectionner
Disallow:/page.html

Mais Google les indexe quand même ... !


Cette ligne est parfaitement correcte. Elle interdit aux robots de Google de visiter les pages dont l'adresse commence par /page.html. En revanche, elle n'interdit pas vraiment d'indexer ces pages.

En pratique, peu de pages où la visite des robots est interdite apparaissent en bonne place dans les résultats de recherche (surtout si ce sont des adresses avec des paramètres après le point d'interrogation).
Haut
Messages: 23098

Enregistré le: 19 Avr 2002

Message le Ven Juin 02, 2017 14:31

ah le fameux coup du "j'ai des pages déjà indexées, j'interdis à Google de retourner les voir et je ne comprends pas pourquoi elles restent indexées"

besoin d'aide ? mon article ici : explications détaillées ou encore plus complet mon webinar gratuit
Haut