Indexation de pages malgré robots.txt

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics

NOche
Nouveau WRInaute
 
Messages: 2
Inscription: Ven Sep 17, 2004 15:54

Indexation de pages malgré robots.txt

Message le Ven Sep 17, 2004 16:15

Bonjour,
Il y a plus d'un mois et demi j'ai mis en place un fichier robots.txt sur le site miseauto.com afin de ne plus permettre l'indexation des pages du répertoire /scripts. Voici le fichier :
Code: Tout sélectionner
User-agent: *
Disallow: /scripts/
Disallow: /cgi-bin/

Malgré cela les pages apparaissent toujours...

Ce qui est d'autant plus bizarre c'est que ces pages n'ont pas de contenu et ne font qu'insérer des données dans la base et/ou rediriger avec un header('location:...') vers d'autres pages.
Si quelqu'un sait pourquoi google s'obstine à indexer ces pages, je suis preneur.

saofe
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 103
Inscription: Ven Juil 23, 2004 13:46

Message le Ven Sep 17, 2004 16:46

Salut,
Le robots.txt est la juste pour empecher le robot de crawler les pages.

A priori, GG respecte cette regle de la netiquette ...

Par contre, il lui arrive de faire entrer dans son index des pages qu'il n'a pas vu,
(elles s'affichent avec juste l'url), c'est des liens qui pointent vers ces pages qui lui ont permis de les connaitre.

C'est un debut d'explication.

Ca pourrait etre aussi que GG n'a pas encore mis a jour la demande de non passage des robots ...

faut verifier dans les logs du serveur web si le robot GG passe sur ces pages ...
mais, ca serait etonnant.

NOche
Nouveau WRInaute
 
Messages: 2
Inscription: Ven Sep 17, 2004 15:54

Message le Ven Sep 17, 2004 16:53

Merci, je pensais qu'il n'indexait que les pages qu'il avait visité.
Il y a en effet des liens vers ces pages sur la home, ça doit être la raison...


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15905
Inscription: Ven Avr 19, 2002 19:51

Message le Ven Sep 17, 2004 17:45

tu devrais aller sur http://services.google.com:8882/urlcons ... tcmd=login (infos : http://www.google.com/remove.html ) pour demander à Google de prendre en compte rapidement les modifs de ton fichier


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Déterminer l'ancienneté d'un site
    Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org).
  • Lister les sous-domaines
    Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités