Indexation de pages malgré robots.txt
4 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Indexation de pages malgré robots.txt
Bonjour,
Il y a plus d'un mois et demi j'ai mis en place un fichier robots.txt sur le site miseauto.com afin de ne plus permettre l'indexation des pages du répertoire /scripts. Voici le fichier :
Malgré cela les pages apparaissent toujours...
Ce qui est d'autant plus bizarre c'est que ces pages n'ont pas de contenu et ne font qu'insérer des données dans la base et/ou rediriger avec un header('location:...') vers d'autres pages.
Si quelqu'un sait pourquoi google s'obstine à indexer ces pages, je suis preneur.
Il y a plus d'un mois et demi j'ai mis en place un fichier robots.txt sur le site miseauto.com afin de ne plus permettre l'indexation des pages du répertoire /scripts. Voici le fichier :
- Code: Tout sélectionner
User-agent: *
Disallow: /scripts/
Disallow: /cgi-bin/
Malgré cela les pages apparaissent toujours...
Ce qui est d'autant plus bizarre c'est que ces pages n'ont pas de contenu et ne font qu'insérer des données dans la base et/ou rediriger avec un header('location:...') vers d'autres pages.
Si quelqu'un sait pourquoi google s'obstine à indexer ces pages, je suis preneur.
Salut,
Le robots.txt est la juste pour empecher le robot de crawler les pages.
A priori, GG respecte cette regle de la netiquette ...
Par contre, il lui arrive de faire entrer dans son index des pages qu'il n'a pas vu,
(elles s'affichent avec juste l'url), c'est des liens qui pointent vers ces pages qui lui ont permis de les connaitre.
C'est un debut d'explication.
Ca pourrait etre aussi que GG n'a pas encore mis a jour la demande de non passage des robots ...
faut verifier dans les logs du serveur web si le robot GG passe sur ces pages ...
mais, ca serait etonnant.
Le robots.txt est la juste pour empecher le robot de crawler les pages.
A priori, GG respecte cette regle de la netiquette ...
Par contre, il lui arrive de faire entrer dans son index des pages qu'il n'a pas vu,
(elles s'affichent avec juste l'url), c'est des liens qui pointent vers ces pages qui lui ont permis de les connaitre.
C'est un debut d'explication.
Ca pourrait etre aussi que GG n'a pas encore mis a jour la demande de non passage des robots ...
faut verifier dans les logs du serveur web si le robot GG passe sur ces pages ...
mais, ca serait etonnant.
-

WebRankInfo - Administrateur du site

- Messages: 15905
- Inscription: Ven Avr 19, 2002 19:51
tu devrais aller sur http://services.google.com:8882/urlcons ... tcmd=login (infos : http://www.google.com/remove.html ) pour demander à Google de prendre en compte rapidement les modifs de ton fichier
4 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Sortie de GoogleStats v2.01
- Les crawlers de Yahoo!
- Googlebot, le robot d'indexation de Google
- Outil officiel de suppression de pages de l'index Google
- Les robots MSNbot de Live Search
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- Déclarer son fichier sitemap dans le fichier robots.txt
- Petit changement pour Slurp (le robot de Yahoo)
- Tout pour indexer vos contenus dans Google
- Robots.txt : Yahoo supporte les options avancées
- Indexation régulière malgré sitemap ?
- Probleme de MAJ Google malgré un bon robots.txt
- robots.txt et indexation
- Indexation robots.txt
- Indexation du fichier robots.txt
- Indexation d'images et robots.txt
- Indexation, robots et url rewriting
- [Robots] Tests , detection , indexation.
- indexation étrange des robots
- indexation du robots.txt!!! bizzare
- Robots.txt et indexation page de recherche
- Problemes de référencement malgré ...
- Formulaire spammé malgré vérif
- Page rank à 0 malgré référencement
- Site bien référencé malgré ...
- Déterminer l'ancienneté d'un site
Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org). - Lister les sous-domaines
Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités


le forum