GG index ma page robots.txt !!!!!
11 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
- rachatdecredits
- WRInaute impliqué

- Messages: 788
- Inscription: 12 Nov 2005
GG index ma page robots.txt !!!!!
Bonjour chers wristes...
Je suis trés surpris de voir que GG a indexé la page robots.txt de mon site, affiche son contenu !!!
Peut on m'expliquer pourquoi, car je trouve ça un peu bcp dangereux ....
voila ce que gg a affiché parmis le ref nat
User-agent: * Disallow: /repinterdit/
User-agent: * Disallow: /repinterdit/
www.domainedemonsite.fr/robots.txt - En cache - Pages similaires
C'est allucinant il affiche meme le nom du repertoire interdit a la navigation
Merci a tous
Je suis trés surpris de voir que GG a indexé la page robots.txt de mon site, affiche son contenu !!!
Peut on m'expliquer pourquoi, car je trouve ça un peu bcp dangereux ....
voila ce que gg a affiché parmis le ref nat
User-agent: * Disallow: /repinterdit/
User-agent: * Disallow: /repinterdit/
www.domainedemonsite.fr/robots.txt - En cache - Pages similaires
C'est allucinant il affiche meme le nom du repertoire interdit a la navigation
Merci a tous
-

5_legs - WRInaute passionné

- Messages: 2072
- Inscription: 30 Avr 2006
Re: GG index ma page robots.txt !!!!!
Effectivement c'est étonnant
D'ailleurs il a aussi indexé le sien : http://xewing.com/rgay5dyf
ou par exemple celui de la maison blanche : http://xewing.com/r24j8xd2
Tu dois être célèbre
Blague mise à part c'est effectivement curieux.
Il n'y aurait pas un lien quelque part vers ton robots.txt ?
D'ailleurs il a aussi indexé le sien : http://xewing.com/rgay5dyf
ou par exemple celui de la maison blanche : http://xewing.com/r24j8xd2
Tu dois être célèbre
Blague mise à part c'est effectivement curieux.
Il n'y aurait pas un lien quelque part vers ton robots.txt ?
- rachatdecredits
- WRInaute impliqué

- Messages: 788
- Inscription: 12 Nov 2005
Re: GG index ma page robots.txt !!!!!
druart a écrit:Effectivement c'est étonnant
D'ailleurs il a aussi indexé le sien : http://xewing.com/rgay5dyf
ou par exemple celui de la maison blanche : http://xewing.com/r24j8xd2
Tu dois être célèbre
Blague mise à part c'est effectivement curieux.
Il n'y aurait pas un lien quelque part vers ton robots.txt ?
Pas tout compris à la blague
Non non aucun lien, ce serait idiot, c'est contraire au principe...
Je me demande si ça n'a pas de rapport avec les outils de GG webmaster qui merdent et qui ref tous les fichiers présents ???
-

WebRankInfo - Administrateur du site

- Messages: 19415
- Inscription: 19 Avr 2002
Re: GG index ma page robots.txt !!!!!
au fait, en quoi est-ce un pb ? il s'agit d'un fichier public accessible à tous
-

nickargall - WRInaute accro

- Messages: 6468
- Inscription: 13 Juin 2005
Re: GG index ma page robots.txt !!!!!
En effet, rien de plus simple que d'aller taper robots.txt à la fin d'un nom de domaine ...
- rachatdecredits
- WRInaute impliqué

- Messages: 788
- Inscription: 12 Nov 2005
Re: GG index ma page robots.txt !!!!!
WebRankInfo a écrit:au fait, en quoi est-ce un pb ? il s'agit d'un fichier public accessible à tous
C'est rare que je pose une question qui invite l'honorable webmaster (olivier) à répondre.
Mode :: Je suis pas peu fier !!!
Sinon, pour en revenir au sujet, j'ai du faire une mauvaise interpretation de l'utilisation du fichier robots.txt.
J'ai cru comprendre que ce fichier permettait d'interdire a GG d'indexer les pages cités (ça c'est ok) et DONC de ne pas indiquer egalement le contenu du fichier permettant de cacher les fichiers cités (et la je me suis trompé).
JE ne sais pas comment faire alors pour eviter que quiconque ne trouve un fichier ou repertoire dans un ref nat.
merci
-

5_legs - WRInaute passionné

- Messages: 2072
- Inscription: 30 Avr 2006
Re: GG index ma page robots.txt !!!!!
WebRankInfo a écrit:au fait, en quoi est-ce un pb ? il s'agit d'un fichier public accessible à tous
Effectivement Olivier ce n'est nullement un problème : on se retrouve avec tellement de curieux qui entrent robots.txt ou sitemap.xml...
Mais ce qui est (à mon sens amusant) c'est de savoir pourquoi ou comment ce fichier est indexé
Après, si on ne veut pas que ses fichiers (ou dossiers) sensibles soient identifiables on fait en sorte de ne pas les afficher là
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Re: GG index ma page robots.txt !!!!!
Pas exactement. Il permet d'interdire à Google de visiter les pages citées. Il arrive que des pages interdites par robots.txt soient indexées sans avoir été visitées par Googlebot.rachatdecredits a écrit:J'ai cru comprendre que ce fichier permettait d'interdire a GG d'indexer les pages cités
Pour être certain qu'une page ne sera pas indexée, il faut que sa visite soit autorisée par robots.txt et qu'elle contienne la balise meta "robots" avec l'option "noindex".
Jean-Luc
- rachatdecredits
- WRInaute impliqué

- Messages: 788
- Inscription: 12 Nov 2005
Re: GG index ma page robots.txt !!!!!
jeanluc a écrit:Pas exactement. Il permet d'interdire à Google de visiter les pages citées. Il arrive que des pages interdites par robots.txt soient indexées sans avoir été visitées par Googlebot.rachatdecredits a écrit:J'ai cru comprendre que ce fichier permettait d'interdire a GG d'indexer les pages cités
Pour être certain qu'une page ne sera pas indexée, il faut que sa visite soit autorisée par robots.txt et qu'elle contienne la balise meta "robots" avec l'option "noindex".
Jean-Luc
Merci jean luc pour cette info.
maintenant cela me pose un pb que gg index mon fichier robots car si quelqu'un le voit, il peut se rendre dans le dit repertoire et visualiser des infos confidentielles? que dois je faire s'il vous plait?
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Re: GG index ma page robots.txt !!!!!
Que Google l'indexe ou pas ne change rien. Tape http://www.ton_site.com/robots.txt dans la barre d'adresse de ton navigateur et tu verras ton fichier robots.txt. Croire que ce fichier est un moyen de sécuriser le site est une idée fausse; c'est uniquement un outil pour donner des instructions aux "bons" robots.
Astuce: tu n'es pas obligé d'indiquer le nom de répertoire exact dans robots.txt. Il suffit d'indiquer les premières lettres (et qu'elles ne correspondent pas à un autre répertoire). Exemple: pour interdire /repertoire-top-secret, tu peux écrire:
Jean-Luc
Astuce: tu n'es pas obligé d'indiquer le nom de répertoire exact dans robots.txt. Il suffit d'indiquer les premières lettres (et qu'elles ne correspondent pas à un autre répertoire). Exemple: pour interdire /repertoire-top-secret, tu peux écrire:
- Code: Tout sélectionner
Disallow /repertoire-to
Jean-Luc
- rachatdecredits
- WRInaute impliqué

- Messages: 788
- Inscription: 12 Nov 2005
Re: GG index ma page robots.txt !!!!!
Super l'astuce, merci beaucoup jeanluc.
Bonne journée
Bonne journée
11 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Sortie de GoogleStats v2.01
- Les crawlers de Yahoo!
- Les robots MSNbot de Live Search
- Déclarer son fichier sitemap dans le fichier robots.txt
- Petit changement pour Slurp (le robot de Yahoo)
- La balise meta NOYDIR de Yahoo
- Robots.txt : Yahoo supporte les options avancées
- Comment gérer simplement les sitemaps de plusieurs sites au même endroit
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité
