Google indexe robots.txt

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics


seebz
WRInaute impliqué
WRInaute impliqué
 
Messages: 808
Inscription: 15 Avr 2007

Google indexe robots.txt

Message le Ven Fév 01, 2008 10:09

Je viens de voir ça et ça me parait bizarre.

http://www.google.be/search?q=inurl%3A.com%2Frobots.txt

Normal ou pas ?


freetopien
WRInaute impliqué
WRInaute impliqué
 
Messages: 942
Inscription: 27 Aoû 2006

Message le Mar Fév 05, 2008 20:48

Si les sites on fait un lien vers leur fichier, oui c'est normal. Google indexe les .txt.

Samantha66
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 13
Inscription: 19 Aoû 2011

Re: Google indexe robots.txt

Message le Lun Sep 26, 2011 16:19

Bonjour,

Je relance ce topic qui date déjà de pas mal d'années, car j'ai un soucis avec le fichiers robots.txt de mon site...celui-ci figure dans l'index de Google. Comment es-ce possible ? Je n'ai aucun lien pointant vers ce fichier.

De plus, il ressort en résultats sur certain mot clé car j'ai dû désindexer des URL via le robots.txt


spout
WRInaute accro
WRInaute accro
 
Messages: 4109
Inscription: 14 Mai 2003

Re: Google indexe robots.txt

Message le Lun Sep 26, 2011 18:36

@Samantha66: tu as une URL à nous montrer ?


UsagiYojimbo
WRInaute accro
WRInaute accro
 
Messages: 8303
Inscription: 23 Nov 2005

Re: Google indexe robots.txt

Message le Lun Sep 26, 2011 18:42

Url ?

Samantha66
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 13
Inscription: 19 Aoû 2011

Re: Google indexe robots.txt

Message le Lun Oct 17, 2011 13:43

Bonjour,

Voici ce que je tape dans google : site:pompes-direct.com robots.txt
Et si je tape une recherche, par exemple : GARDENJETNOX et bien je tombe sur mon robots.txt parce que j'ai dû désindexer l'adresse...

Quelqu'un a t-il une piste ?


Tigerfou
WRInaute discret
WRInaute discret
 
Messages: 186
Inscription: 16 Juin 2011

Re: Google indexe robots.txt

Message le Jeu Oct 20, 2011 14:33

Bonjour,

Comme il a déjà été signalé, s'il existe un lien vers ton fichier robots, c'est pas surprenant. Il te faut trouver le lien en question et le retirer, je ne vois pas d'autre solution. Tu peux aussi essayer de le supprimer de l'index depuis Webmaster tools, mais j'ignore si ce sera permanent.

Juste pour rigoler, quelqu'un à déjà essayé d'interdire l'accès à son robots.txt depuis lui-même ? :lol:

Johann


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 18958
Inscription: 19 Avr 2002

Re: Google indexe robots.txt

Message le Jeu Oct 20, 2011 14:40

le pb est qu'on ne veut pas empêcher le crawler de consulter la page, mais l'empêcher de l'indexer

Samantha66
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 13
Inscription: 19 Aoû 2011

Re: Google indexe robots.txt

Message le Jeu Oct 20, 2011 14:44

Merci pour vos réponses.

Je vais tester de le disallow dans le robots.txt :D

Sinon comment je peux faire pour trouver le lien par lequel il a été indexer ? J'ai déjà fais une liste des liens avec Xenu et aucune trace du robots.txt.


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 18958
Inscription: 19 Avr 2002

Re: Google indexe robots.txt

Message le Jeu Oct 20, 2011 14:46

il te reste à lancer Xenu sur tout le reste du web pour trouver le fautif :-)


Tigerfou
WRInaute discret
WRInaute discret
 
Messages: 186
Inscription: 16 Juin 2011

Re: Google indexe robots.txt

Message le Jeu Oct 20, 2011 14:52

Je crois que tu peux dire merci à woorank :

http://lmgtfy.com/?q=%22http%3A%2F%2Fwww.pompes-direct.com%2Frobots.txt%22

Bon courage pour te débarrasser du lien... Ceci dit c'est pas dramatique qu'il soit indexé ton robots.txt. A moins qu'il cache une partie secrète de ton site :?

tendancefruit
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 1
Inscription: 10 Oct 2011

Re: Google indexe robots.txt

Message le Jeu Oct 20, 2011 14:55

Salut!

Il faut utiliser les X-Robots-Tag HTTP headers pour interdire l'indexation du fichier robots.txt.
Pour plus d'informations: http://code.google.com/web/controlcrawlindex/docs/robots_meta_tag.html (en anglais)

"The X-Robots-Tag can be used as an element of the HTTP header response for a given URL. Any directive that can used in an robots meta tag can also be specified as an X-Robots-Tag. Here's an example of an HTTP response with an X-Robots-Tag instructing crawlers not to index a page....."

Il n'y a pas d'autre solution.


lunicrea
WRInaute impliqué
WRInaute impliqué
 
Messages: 501
Inscription: 30 Aoû 2010

Re: Google indexe robots.txt

Message le Jeu Oct 20, 2011 15:03

Ok d'accord ... c'est donc woorank qui m'a fait cette farce aussi ! :roll:

D'ailleurs, je vois plein de sites très bizarres en rapport avec le nom de ma société, exemple :
Capture d'écran des 2 sites + le fameux woorank

On peut voir que pour les 2 premiers, ce sont apparemment une copie pure et simple des pages YouTube ...

tendancefruit a écrit:Il n'y a pas d'autre solution.

Bon ben j'ai modifié mon .htaccess en fonction donc on verra bien ! merci pour le lien !
Code: Tout sélectionner
<Files ~ "robots\.txt$">
  Header set X-Robots-Tag "noindex"
</Files>


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 18958
Inscription: 19 Avr 2002

Re: Google indexe robots.txt

Message le Jeu Oct 20, 2011 15:17

Oui tendancefruit je pense que tu as raison... j'y avais pensé mais je ne l'ai jamais testé pour un fichier robots.txt ! pour ceux qui veulent des explications en français : l'entête X-Robots-Tag

ça veut dire qu'il faut gérer le fichier robots.txt par un script serveur qui rajoute l'entête HTTP ? et donc faire de la réécriture d'URL du fichier robots.txt ? Les petits malins découvriront peut-être qu'on peut faire du cloaking sur le fichier robots.txt ;-)

Edit : merci lunicrea pour le code .htaccess, c'est sans doute le plus simple effectivement

Samantha66
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 13
Inscription: 19 Aoû 2011

Re: Google indexe robots.txt

Message le Ven Nov 25, 2011 9:27

Un grand merci (en retard) à tous pour vos réponses !

Google indexe robots.txt

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités