robots.txt pas l'air d'être prise en compte par GG...
5 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

dubstyle - WRInaute discret

- Messages: 67
- Inscription: 17 Mai 2005
robots.txt pas l'air d'être prise en compte par GG...
Bonjour tout le monde,
N'ayant pas réussi à comprendre pourquoi mon fichier robots.txt n'est pas (totalement) pris en compte par GG, je fais appel à votre savoir sur le sujet...
Le problème :
GG m'indexe des fichiers .swf (tout seul), une page webmail, et surtout la page d'accès à l'admin du site
bien que mon fichier robots.txt lui indique de ne pas indexer ces pages/fichiers
Je me suis dit que ça venait du fait que le Googlebot met un peu de temps à passer mais non, il passe en moyenne entre 3 à 8 fois par jour (il est même déjà passé 28 fois en une journée
)....
le site en question :
-http://www.partytime.fr
Je m'en remet à votre bienfaisance
... merci
N'ayant pas réussi à comprendre pourquoi mon fichier robots.txt n'est pas (totalement) pris en compte par GG, je fais appel à votre savoir sur le sujet...
Le problème :
GG m'indexe des fichiers .swf (tout seul), une page webmail, et surtout la page d'accès à l'admin du site
Je me suis dit que ça venait du fait que le Googlebot met un peu de temps à passer mais non, il passe en moyenne entre 3 à 8 fois par jour (il est même déjà passé 28 fois en une journée
le site en question :
Je m'en remet à votre bienfaisance
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Bonjour,
L'adresse d'une page peut apparaître dans les résultats sans que la page ne soit visitée par Google. C'est peut-être ce qui se passe pour les .swf et les pages d'admin. C'est conforme au Protocole d'Exclusion des Robots qui interdit les accès à une adresse, mais pas la mention de celle-ci dans des résultats de recherche ou ailleurs.
Pour webmail, je remplacerais Disallow: /webmail.php$ par Disallow: /webmail.php.
Jean-Luc
L'adresse d'une page peut apparaître dans les résultats sans que la page ne soit visitée par Google. C'est peut-être ce qui se passe pour les .swf et les pages d'admin. C'est conforme au Protocole d'Exclusion des Robots qui interdit les accès à une adresse, mais pas la mention de celle-ci dans des résultats de recherche ou ailleurs.
Pour webmail, je remplacerais Disallow: /webmail.php$ par Disallow: /webmail.php.
Jean-Luc
- buscoperro
- WRInaute discret

- Messages: 86
- Inscription: 29 Nov 2005
Au fait, à quoi sert en théorie le "$" ??? j'avais jamais vu ça dans un robots.txt
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Bonjour,
Tu as raison. L'emploi des caractères * et $ n'est pas conforme au Protocole d'Exclusion des Robots qui définit le format du fichier robots.txt.
Il s'agit d'une extension acceptée par Googlebot et msnbot. Cette syntaxe ne devrait être utilisée qu'après un User-agent: Googlebot ou un User-agent: msnbot.
Jean-Luc
Tu as raison. L'emploi des caractères * et $ n'est pas conforme au Protocole d'Exclusion des Robots qui définit le format du fichier robots.txt.
Il s'agit d'une extension acceptée par Googlebot et msnbot. Cette syntaxe ne devrait être utilisée qu'après un User-agent: Googlebot ou un User-agent: msnbot.
Jean-Luc
5 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Temps de prise en compte de robots.txt
- Durée prise en compte Robots.txt
- prise en compte du passage des robots dans Analytics
- Desindexer des pages via robots.txt. Bonne prise en compte ?
- délai de prise en compte du <meta name="robots" content="none" /> pour pages déjà indéxées
- Prise en charge du tag html robots
- Redirection 301 non prise en compte
- délai de prise en compte du sitemap
- suppression url non prise en compte !
- Prise en compte du favicon.ico
Consultez la description détaillée des produits ou services de Google suivants : Google ReadAir
- Liste des backlinks
Cet outil vous permet d'analyser en détails la "popularité" de votre site sur Google. En plus du nombre de liens pris en compte par Google, il calcule le pourcentage de liens internes parmi tous les liens, et il affiche les premières URL trouvées. - Google Browser TouchGraph
Description du TouchGraph Google Browser (outil externe) : il s'agit d'un outil graphique permettant de visualiser des sites similaires (selon Google). On peut sauter de site en site, et se rendre compte facilement des communautés de sites, ou des nébuleuses de sites traitant du même sujet.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
