Problème pour effacer pages dynamiques avec robots.txt
3 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
-

informatruc - WRInaute occasionnel

- Messages: 224
- Inscription: Ven Jan 16, 2004 3:31
Problème pour effacer pages dynamiques avec robots.txt
Bonjour,
Google dit:
Par contre, quand je vais sur le "système de suppression automatique d'URL", j'ai ce message:
Pourtant, Google dit ceci:
Pensez vous que c'est seulement le système de suppression automatique d'URL qui ne prend pas les caractères génériques? Googlebot vat-il en tenir compte?
Merci.
Google dit:
Google a écrit:Pour supprimer les pages générées dynamiquement, utilisez l'entrée robots.txt
suivante :
User-agent: Googlebot
Disallow: /*?
Par contre, quand je vais sur le "système de suppression automatique d'URL", j'ai ce message:
Google a écrit:Les URL ne doivent pas comporter de caractères génériques (« * », par
exemple). La ligne suivante comporte un caractère générique :
DISALLOW /annuaire/*?
Pourtant, Google dit ceci:
Google a écrit:Google a en outre renforcé la souplesse d'utilisation du protocole robots.txt
grâce à la prise en charge des astérisques. Les formats d'interdiction peuvent
inclure le signe « * » pour remplacer toute séquence de caractères et se
terminer par le symbole « $ » pour indiquer la fin d'un nom.
Pensez vous que c'est seulement le système de suppression automatique d'URL qui ne prend pas les caractères génériques? Googlebot vat-il en tenir compte?
Merci.
Re: Problème pour effacer pages dynamiques avec robots.txt
informatruc a écrit:Pensez vous que c'est seulement le système de suppression automatique d'URL qui ne prend pas les caractères génériques? Googlebot vat-il en tenir compte?
Bonjour,
Je n'obtiens pas le même message que toi à travers le lien du système de suppression d'URL, mais je pense que ton explication est la seule possible.
De toute façon, l'emploi des "*" ne fait pas partie du Protocole d'Exclusion des Robots standard. Il faut donc en limiter son emploi aux instructions qui suivent
- Code: Tout sélectionner
User-agent: Googlebot
Jean-Luc
Une autre méthode, probablement plus rapide que la désindexation par robots.txt (qui peut prendre des années dans certains cas), serait d'utiliser une règle .htaccess. redirigeant les pages à indexer vers une 404 ou vers ta page d'accueil en 301...
3 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Référencement d'un forum phpBB
- Référencement : le problème des sessions des pages PHP
- Déclarer son fichier sitemap dans le fichier robots.txt
- Tutoriel URL Rewriting
- Le référencement de pages PHP
- Sortie de GoogleStats v2.01
- Explications sur le Crawl Caching Proxy de Google
- Les crawlers de Yahoo!
- Séminaire sur le référencement : ImiTiki - Online 2005
- Du nouveau dans le Centre pour Webmasters de Live Search
- robots txt et pages dynamiques
- robots.txt et pages dynamiques
- utilisation de robots.txt pour bloquer les pages dynamiques
- Problème de robots.txt
- Probleme ROBOTS.TXT
- Problème de passage des robots
- probleme avec robots.txt ?
- Problème avec les robots
- Erreur de référencement : problème de robots ?
- problème avec le fichier robots.txt
- Problème pages similaires et robots.txt
- Problème google réindex de mauvaises page interdites robots.
- Probleme de MAJ Google malgré un bon robots.txt
- Probleme de robots.txt sur sous domaine : google index !!!!
- éffacer les doublon
Consultez la description détaillée des produits ou services de Google suivants : Google Sitemaps, Omnisio
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités




le forum