robots.txt pas l'air d'être prise en compte par GG...

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics


dubstyle
WRInaute discret
WRInaute discret
 
Messages: 67
Inscription: 17 Mai 2005

robots.txt pas l'air d'être prise en compte par GG...

Message le Mer Nov 30, 2005 10:40

Bonjour tout le monde,

N'ayant pas réussi à comprendre pourquoi mon fichier robots.txt n'est pas (totalement) pris en compte par GG, je fais appel à votre savoir sur le sujet...

Le problème :
GG m'indexe des fichiers .swf (tout seul), une page webmail, et surtout la page d'accès à l'admin du site :? bien que mon fichier robots.txt lui indique de ne pas indexer ces pages/fichiers :x
Je me suis dit que ça venait du fait que le Googlebot met un peu de temps à passer mais non, il passe en moyenne entre 3 à 8 fois par jour (il est même déjà passé 28 fois en une journée :lol: )....

le site en question : :arrow: -http://www.partytime.fr

Je m'en remet à votre bienfaisance :wink:... merci


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: 3 Mai 2004

Message le Mer Nov 30, 2005 11:12

Bonjour,

L'adresse d'une page peut apparaître dans les résultats sans que la page ne soit visitée par Google. C'est peut-être ce qui se passe pour les .swf et les pages d'admin. C'est conforme au Protocole d'Exclusion des Robots qui interdit les accès à une adresse, mais pas la mention de celle-ci dans des résultats de recherche ou ailleurs.

Pour webmail, je remplacerais Disallow: /webmail.php$ par Disallow: /webmail.php.

Jean-Luc


dubstyle
WRInaute discret
WRInaute discret
 
Messages: 67
Inscription: 17 Mai 2005

Message le Mer Nov 30, 2005 12:23

merci pour l'info... :wink:

buscoperro
WRInaute discret
WRInaute discret
 
Messages: 86
Inscription: 29 Nov 2005

Message le Mer Nov 30, 2005 14:27

Au fait, à quoi sert en théorie le "$" ??? j'avais jamais vu ça dans un robots.txt


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: 3 Mai 2004

Message le Mer Nov 30, 2005 14:37

Bonjour,

Tu as raison. L'emploi des caractères * et $ n'est pas conforme au Protocole d'Exclusion des Robots qui définit le format du fichier robots.txt.

Il s'agit d'une extension acceptée par Googlebot et msnbot. Cette syntaxe ne devrait être utilisée qu'après un User-agent: Googlebot ou un User-agent: msnbot.

Jean-Luc


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google ReadAir

  • Liste des backlinks
    Cet outil vous permet d'analyser en détails la "popularité" de votre site sur Google. En plus du nombre de liens pris en compte par Google, il calcule le pourcentage de liens internes parmi tous les liens, et il affiche les premières URL trouvées.
  • Google Browser TouchGraph
    Description du TouchGraph Google Browser (outil externe) : il s'agit d'un outil graphique permettant de visualiser des sites similaires (selon Google). On peut sauter de site en site, et se rendre compte facilement des communautés de sites, ou des nébuleuses de sites traitant du même sujet.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités