GG index ma page robots.txt !!!!!

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

rachatdecredits
WRInaute impliqué
WRInaute impliqué
 
Messages: 788
Inscription: 12 Nov 2005

GG index ma page robots.txt !!!!!

Message le Lun Juin 15, 2009 12:07

Bonjour chers wristes...

Je suis trés surpris de voir que GG a indexé la page robots.txt de mon site, affiche son contenu !!!

Peut on m'expliquer pourquoi, car je trouve ça un peu bcp dangereux ....

voila ce que gg a affiché parmis le ref nat


User-agent: * Disallow: /repinterdit/
User-agent: * Disallow: /repinterdit/
www.domainedemonsite.fr/robots.txt - En cache - Pages similaires

C'est allucinant il affiche meme le nom du repertoire interdit a la navigation 8O

Merci a tous


5_legs
WRInaute passionné
WRInaute passionné
 
Messages: 2072
Inscription: 30 Avr 2006

Re: GG index ma page robots.txt !!!!!

Message le Lun Juin 15, 2009 12:24

Effectivement c'est étonnant

D'ailleurs il a aussi indexé le sien : http://xewing.com/rgay5dyf
ou par exemple celui de la maison blanche : http://xewing.com/r24j8xd2

Tu dois être célèbre :-)

Blague mise à part c'est effectivement curieux.
Il n'y aurait pas un lien quelque part vers ton robots.txt ?

rachatdecredits
WRInaute impliqué
WRInaute impliqué
 
Messages: 788
Inscription: 12 Nov 2005

Re: GG index ma page robots.txt !!!!!

Message le Lun Juin 15, 2009 13:47

druart a écrit:Effectivement c'est étonnant

D'ailleurs il a aussi indexé le sien : http://xewing.com/rgay5dyf
ou par exemple celui de la maison blanche : http://xewing.com/r24j8xd2

Tu dois être célèbre :-)

Blague mise à part c'est effectivement curieux.
Il n'y aurait pas un lien quelque part vers ton robots.txt ?


Pas tout compris à la blague :?

Non non aucun lien, ce serait idiot, c'est contraire au principe...
Je me demande si ça n'a pas de rapport avec les outils de GG webmaster qui merdent et qui ref tous les fichiers présents ???


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 19415
Inscription: 19 Avr 2002

Re: GG index ma page robots.txt !!!!!

Message le Lun Juin 15, 2009 15:40

au fait, en quoi est-ce un pb ? il s'agit d'un fichier public accessible à tous


nickargall
WRInaute accro
WRInaute accro
 
Messages: 6468
Inscription: 13 Juin 2005

Re: GG index ma page robots.txt !!!!!

Message le Lun Juin 15, 2009 16:14

En effet, rien de plus simple que d'aller taper robots.txt à la fin d'un nom de domaine ...

rachatdecredits
WRInaute impliqué
WRInaute impliqué
 
Messages: 788
Inscription: 12 Nov 2005

Re: GG index ma page robots.txt !!!!!

Message le Lun Juin 15, 2009 21:18

WebRankInfo a écrit:au fait, en quoi est-ce un pb ? il s'agit d'un fichier public accessible à tous


C'est rare que je pose une question qui invite l'honorable webmaster (olivier) à répondre.

Mode :: Je suis pas peu fier !!! :lol:

Sinon, pour en revenir au sujet, j'ai du faire une mauvaise interpretation de l'utilisation du fichier robots.txt.

J'ai cru comprendre que ce fichier permettait d'interdire a GG d'indexer les pages cités (ça c'est ok) et DONC de ne pas indiquer egalement le contenu du fichier permettant de cacher les fichiers cités (et la je me suis trompé).

JE ne sais pas comment faire alors pour eviter que quiconque ne trouve un fichier ou repertoire dans un ref nat.

merci


5_legs
WRInaute passionné
WRInaute passionné
 
Messages: 2072
Inscription: 30 Avr 2006

Re: GG index ma page robots.txt !!!!!

Message le Lun Juin 15, 2009 21:29

WebRankInfo a écrit:au fait, en quoi est-ce un pb ? il s'agit d'un fichier public accessible à tous



Effectivement Olivier ce n'est nullement un problème : on se retrouve avec tellement de curieux qui entrent robots.txt ou sitemap.xml...

Mais ce qui est (à mon sens amusant) c'est de savoir pourquoi ou comment ce fichier est indexé ;-)

Après, si on ne veut pas que ses fichiers (ou dossiers) sensibles soient identifiables on fait en sorte de ne pas les afficher là ;-)


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: 3 Mai 2004

Re: GG index ma page robots.txt !!!!!

Message le Lun Juin 15, 2009 21:41

rachatdecredits a écrit:J'ai cru comprendre que ce fichier permettait d'interdire a GG d'indexer les pages cités
Pas exactement. Il permet d'interdire à Google de visiter les pages citées. Il arrive que des pages interdites par robots.txt soient indexées sans avoir été visitées par Googlebot.

Pour être certain qu'une page ne sera pas indexée, il faut que sa visite soit autorisée par robots.txt et qu'elle contienne la balise meta "robots" avec l'option "noindex".

Jean-Luc

rachatdecredits
WRInaute impliqué
WRInaute impliqué
 
Messages: 788
Inscription: 12 Nov 2005

Re: GG index ma page robots.txt !!!!!

Message le Mar Juin 16, 2009 11:41

jeanluc a écrit:
rachatdecredits a écrit:J'ai cru comprendre que ce fichier permettait d'interdire a GG d'indexer les pages cités
Pas exactement. Il permet d'interdire à Google de visiter les pages citées. Il arrive que des pages interdites par robots.txt soient indexées sans avoir été visitées par Googlebot.

Pour être certain qu'une page ne sera pas indexée, il faut que sa visite soit autorisée par robots.txt et qu'elle contienne la balise meta "robots" avec l'option "noindex".

Jean-Luc


Merci jean luc pour cette info.

maintenant cela me pose un pb que gg index mon fichier robots car si quelqu'un le voit, il peut se rendre dans le dit repertoire et visualiser des infos confidentielles? que dois je faire s'il vous plait?


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: 3 Mai 2004

Re: GG index ma page robots.txt !!!!!

Message le Mar Juin 16, 2009 11:49

Que Google l'indexe ou pas ne change rien. Tape http://www.ton_site.com/robots.txt dans la barre d'adresse de ton navigateur et tu verras ton fichier robots.txt. Croire que ce fichier est un moyen de sécuriser le site est une idée fausse; c'est uniquement un outil pour donner des instructions aux "bons" robots.

Astuce: tu n'es pas obligé d'indiquer le nom de répertoire exact dans robots.txt. Il suffit d'indiquer les premières lettres (et qu'elles ne correspondent pas à un autre répertoire). Exemple: pour interdire /repertoire-top-secret, tu peux écrire:
Code: Tout sélectionner
Disallow /repertoire-to

Jean-Luc

rachatdecredits
WRInaute impliqué
WRInaute impliqué
 
Messages: 788
Inscription: 12 Nov 2005

Re: GG index ma page robots.txt !!!!!

Message le Mer Juin 17, 2009 10:13

Super l'astuce, merci beaucoup jeanluc.

Bonne journée


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité