Page indéxé malgré un Disallow

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics


allan62340
WRInaute discret
WRInaute discret
 
Messages: 163
Inscription: 10 Avr 2011

Page indéxé malgré un Disallow

Message le Ven Nov 04, 2011 9:33

Bonjour,

Je travaille dans une agence de référencement et ce matin surprise !
Nous travaillons sur des projets clients et nous les stockons dans un répertoire http://monagence/clients/...

Dans le robot.txt de mon agence nous avons mis en place un
Disallow: /clients/*

Or ce matin en lançant une requête sur Google, je trouve indéxé des url
http://monagence/clients/monclient

Comment faire pour résoudre ce soucis ?

Bien cordialement
Allan


UsagiYojimbo
WRInaute accro
WRInaute accro
 
Messages: 8575
Inscription: 23 Nov 2005

Re: Page indéxé malgré un Disallow

Message le Ven Nov 04, 2011 9:57

Un site de dev ne doit pas être accessible aussi simplement, robots.txt ou pas. Protection htaccess, serveur local, bref les moyens de manquent pourtant pas pour éviter ce genre de choses.


allan62340
WRInaute discret
WRInaute discret
 
Messages: 163
Inscription: 10 Avr 2011

Re: Page indéxé malgré un Disallow

Message le Ven Nov 04, 2011 10:07

Nos sites clients sont protégés par un .htaccess mais le soucis est l'indexation des pages. même si elles sont inaccessibles c'est assez génant


UsagiYojimbo
WRInaute accro
WRInaute accro
 
Messages: 8575
Inscription: 23 Nov 2005

Re: Page indéxé malgré un Disallow

Message le Ven Nov 04, 2011 10:15

Si le bot a pu passer et indexer les pages, c'est bien la preuve que la protection .htaccess ne fonctionne pas, non ?


erestrebian
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 472
Inscription: 15 Juin 2007

Re: Page indéxé malgré un Disallow

Message le Ven Nov 04, 2011 14:14

UsagiYojimbo a écrit:Si le bot a pu passer et indexer les pages, c'est bien la preuve que la protection .htaccess ne fonctionne pas, non ?

Et qu'elles doivent être accessibles à beaucoup de gens...

soldiez
WRInaute discret
WRInaute discret
 
Messages: 216
Inscription: 7 Fév 2009

Re: Page indéxé malgré un Disallow

Message le Ven Nov 04, 2011 15:30

il suffit que tu fasses un lien vers /client/fichier.xxx depuis une page indexée dans les moteurs de recherche et hop, les crawler passent au dessus de ton fichier robot. il faudrait au minima quand on fait ça mettre du nofollow sur l'ensemble de ton contenu dans ce répertoire...


forty
WRInaute passionné
WRInaute passionné
 
Messages: 1701
Inscription: 30 Oct 2008

Re: Page indéxé malgré un Disallow

Message le Ven Nov 04, 2011 15:58

c'est robots.txt pas robot.txt

c'est sur qu'il vaut mieux une protection par htpassword


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Déterminer l'âge d'un site
    Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org).
  • Indice de densité
    Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page.
  • Analyseur d'entête HTTP
    Cet outil vous permet de connaître le code HTTP renvoyé par le serveur pour une page donnée.
  • Calcul du taux de liens profonds
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.


Qui est en ligne

Utilisateurs parcourant ce forum: franckM et 1 invité