Page notée erreur html par google. Comment y remedier ?

Règles du forum
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !

Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

ShonGail
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 9
Inscription: 5 Nov 2006

Page notée erreur html par google. Comment y remedier ?

Message le Ven Nov 17, 2006 22:58

Bonjour :)

je débute en référencement. :oops:

J'ai un site avec plusieurs pages php. L'une d'elle contient un lien vers une page php située dans un répertoire /admin/
Ce répertoire est protégé par un .htaccess car la page qu'il contient sert à gérer certains contenus des autres pages du site.

Google a voulu indexer cette page, n'a pas pu (normal), et m'indique désormais dans mon compte webmaster que cette page est en "erreur http" (401, non autorisée). Le dernier calcul de cette page est notifiée au 02 novembre.

Depuis, pour éviter que Google tente de réindexer cette page, j'ai créé avant le 05 novembre un fichier sitemap.xml qui ne contient pas cette URL et un fichier robot.txt (EDIT : "robots.txt" pardon) qui contient :

user-agent: *
disallow: /admin/

De plus j'ai indiqué y'a quelques jours à Google de retirer cette URL de son index.

Pourtant, elle reste indiquée comme erreur HTTP et dans mes logs apache, entre les accès de google à mes pages, je retrouve constamment cela :
66.102.6.136 - - [17/Nov/2006:12:24:43 +0100] "GET /admin/admin.php HTTP/1.0" 401 511 "-" "Java/1.5.0_04"

Pourquoi Google tente t'il encore et encore d'accéder à cette page malgré mon robot.txt ?
Comment y remedier ?

Merci :)
Dernière édition par ShonGail le Ven Nov 17, 2006 23:12, édité 1 fois.

nexxen
WRInaute discret
WRInaute discret
 
Messages: 76
Inscription: 30 Déc 2004

Message le Ven Nov 17, 2006 23:05

robots.text serait sans doute mieux :wink:

ShonGail
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 9
Inscription: 5 Nov 2006

Message le Ven Nov 17, 2006 23:11

Oui c'est vrai :D

mais en fait c'est déjà le cas. Donc c'est pas ça :?

D'ailleurs mon robots.txt est bien lu par google. Il l'indique dans mes outils pour webmaster et je vois dans mes logs apache qu'il est régulièrement lu.


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Calcul d'indice de densité
    Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page.
  • Test HTTP header
    Cet outil vous permet de connaître le code HTTP renvoyé par le serveur pour une page donnée.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité