Problème pour effacer pages dynamiques avec robots.txt

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


informatruc
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 224
Inscription: Ven Jan 16, 2004 3:31

Problème pour effacer pages dynamiques avec robots.txt

Message le Mar Déc 20, 2005 3:53

Bonjour,

Google dit:

Google a écrit:Pour supprimer les pages générées dynamiquement, utilisez l'entrée robots.txt
suivante :

User-agent: Googlebot
Disallow: /*?


Par contre, quand je vais sur le "système de suppression automatique d'URL", j'ai ce message:

Google a écrit:Les URL ne doivent pas comporter de caractères génériques (« * », par
exemple). La ligne suivante comporte un caractère générique :
DISALLOW /annuaire/*?


Pourtant, Google dit ceci:

Google a écrit:Google a en outre renforcé la souplesse d'utilisation du protocole robots.txt
grâce à la prise en charge des astérisques. Les formats d'interdiction peuvent
inclure le signe « * » pour remplacer toute séquence de caractères et se
terminer par le symbole « $ » pour indiquer la fin d'un nom.


Pensez vous que c'est seulement le système de suppression automatique d'URL qui ne prend pas les caractères génériques? Googlebot vat-il en tenir compte?

Merci.


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2659
Inscription: Lun Mai 03, 2004 14:48

Re: Problème pour effacer pages dynamiques avec robots.txt

Message le Mar Déc 20, 2005 7:35

informatruc a écrit:Pensez vous que c'est seulement le système de suppression automatique d'URL qui ne prend pas les caractères génériques? Googlebot vat-il en tenir compte?

Bonjour,

Je n'obtiens pas le même message que toi à travers le lien du système de suppression d'URL, mais je pense que ton explication est la seule possible.

De toute façon, l'emploi des "*" ne fait pas partie du Protocole d'Exclusion des Robots standard. Il faut donc en limiter son emploi aux instructions qui suivent
Code: Tout sélectionner
User-agent: Googlebot
et Googlebot devrait les comprendre.

Jean-Luc


HawkEye
Modérateur
Modérateur
 
Messages: 15040
Inscription: Lun Fév 23, 2004 12:33

Message le Mar Déc 20, 2005 8:32

Une autre méthode, probablement plus rapide que la désindexation par robots.txt (qui peut prendre des années dans certains cas), serait d'utiliser une règle .htaccess. redirigeant les pages à indexer vers une 404 ou vers ta page d'accueil en 301...


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google Sitemaps, Omnisio



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités