délai de prise en compte du <meta name="robots" content="none" /> pour pages déjà indéxées

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

doncarlos
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 23
Inscription: 24 Nov 2006

délai de prise en compte du <meta name="robots" content="none" /> pour pages déjà indéxées

Message le Dim Sep 26, 2010 20:05

Bonjour,
cette balise a été ajoutée à de nombreuses pages de mon site il y a 2mois.
Aujourd'hui, ces pages sont encore trouvées via une recherche google et sont encore indéxées.

Pour information, j'ai effectué cette action pour lutter contre la duplication de contenu.

Après avoir lu le forum :
1/ Certains conseillent d'envoyer un code 404 :
Dans ce cas, est-ce que ma page s'affiche?
Comment faire?

2/ D'autre, propose d'accelérer la désindexation, ajouter un filfrage dans le robots.txt?
Ok, si je veux désindexer toutes les pages qui commence par produit-catalogue
comme www.monsite.com/produit-catalogue-xxxxx.html.
Le code ci-dessous fonctionne t-il dans le robots.txt?
User-agent: *
Disallow: /produit-catalogue-*

Merci.

franckM
WRInaute impliqué
WRInaute impliqué
 
Messages: 823
Inscription: 15 Nov 2007

Re: délai de prise en compte du <meta name="robots" content="none" /> pour pages déjà indéxées

Message le Dim Sep 26, 2010 21:50

Bonsoir,

le mieux est d'utiliser le robots.txt

@ +

Franck


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: 3 Mai 2004

Re: délai de prise en compte du <meta name="robots" content="none" /> pour pages déjà indéxées

Message le Dim Sep 26, 2010 22:52

Si c'est pour éviter le duplicate content, le mieux est d'utiliser la balise META "canonical". Pour en savoir plus: http://www.webrankinfo.com/dossiers/techniques/url-canonique

Jean-Luc

doncarlos
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 23
Inscription: 24 Nov 2006

Re: délai de prise en compte du <meta name="robots" content="none" /> pour pages déjà indéxées

Message le Lun Sep 27, 2010 10:10

merci pour vos 2 réponses:

Remarque aux 2 réponses:
la première réponse :
Si c'est pour éviter le duplicate content, le mieux est d'utiliser la balise META "canonical". Pour en savoir plus: http://www.webrankinfo.com/dossiers/techniques/url-canonique

Je ne peux utiliser la balise META "canonical" car je lis un catalogue commerçant et je n'ai pas le lien de la page originale.
En outre, même si je l'avais, le texte est différent sur le site original mais le catalogue est distribué sur d'autre site.

la deuxième réponse :
le mieux est d'utiliser le robots.txt

Est-ce que mon code est correct?
Code: Tout sélectionner
User-agent: *
Disallow: /produit-catalogue-*

doncarlos
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 23
Inscription: 24 Nov 2006

Re: délai de prise en compte du <meta name="robots" content="none" /> pour pages déjà indéxées

Message le Lun Sep 27, 2010 14:06

Après une recherche sur le web, si j'ai bien compris :
pour filtrer les pages commençant par produit-catalogue-******-.html
je code ça dans le robots.txt

Code: Tout sélectionner
User-agent: *
Disallow: /produit-catalogue


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: 3 Mai 2004

Re: délai de prise en compte du <meta name="robots" content="none" /> pour pages déjà indéxées

Message le Lun Sep 27, 2010 20:04

Oui. Cela va filtrer tout ce qui commence par /produit-catalogue.

Jean-Luc


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: jolm et 1 invité