Google indexe robots.txt
18 messages
• Page 1 sur 2 • 1, 2
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

seebz - WRInaute impliqué

- Messages: 808
- Inscription: 15 Avr 2007
Google indexe robots.txt
Je viens de voir ça et ça me parait bizarre.
http://www.google.be/search?q=inurl%3A.com%2Frobots.txt
Normal ou pas ?
http://www.google.be/search?q=inurl%3A.com%2Frobots.txt
Normal ou pas ?
-

freetopien - WRInaute impliqué

- Messages: 942
- Inscription: 27 Aoû 2006
Si les sites on fait un lien vers leur fichier, oui c'est normal. Google indexe les .txt.
- Samantha66
- Nouveau WRInaute

- Messages: 13
- Inscription: 19 Aoû 2011
Re: Google indexe robots.txt
Bonjour,
Je relance ce topic qui date déjà de pas mal d'années, car j'ai un soucis avec le fichiers robots.txt de mon site...celui-ci figure dans l'index de Google. Comment es-ce possible ? Je n'ai aucun lien pointant vers ce fichier.
De plus, il ressort en résultats sur certain mot clé car j'ai dû désindexer des URL via le robots.txt
Je relance ce topic qui date déjà de pas mal d'années, car j'ai un soucis avec le fichiers robots.txt de mon site...celui-ci figure dans l'index de Google. Comment es-ce possible ? Je n'ai aucun lien pointant vers ce fichier.
De plus, il ressort en résultats sur certain mot clé car j'ai dû désindexer des URL via le robots.txt
-

UsagiYojimbo - WRInaute accro

- Messages: 8303
- Inscription: 23 Nov 2005
Re: Google indexe robots.txt
Url ?
- Samantha66
- Nouveau WRInaute

- Messages: 13
- Inscription: 19 Aoû 2011
Re: Google indexe robots.txt
Bonjour,
Voici ce que je tape dans google : site:pompes-direct.com robots.txt
Et si je tape une recherche, par exemple : GARDENJETNOX et bien je tombe sur mon robots.txt parce que j'ai dû désindexer l'adresse...
Quelqu'un a t-il une piste ?
Voici ce que je tape dans google : site:pompes-direct.com robots.txt
Et si je tape une recherche, par exemple : GARDENJETNOX et bien je tombe sur mon robots.txt parce que j'ai dû désindexer l'adresse...
Quelqu'un a t-il une piste ?
-

Tigerfou - WRInaute discret

- Messages: 186
- Inscription: 16 Juin 2011
Re: Google indexe robots.txt
Bonjour,
Comme il a déjà été signalé, s'il existe un lien vers ton fichier robots, c'est pas surprenant. Il te faut trouver le lien en question et le retirer, je ne vois pas d'autre solution. Tu peux aussi essayer de le supprimer de l'index depuis Webmaster tools, mais j'ignore si ce sera permanent.
Juste pour rigoler, quelqu'un à déjà essayé d'interdire l'accès à son robots.txt depuis lui-même ?
Johann
Comme il a déjà été signalé, s'il existe un lien vers ton fichier robots, c'est pas surprenant. Il te faut trouver le lien en question et le retirer, je ne vois pas d'autre solution. Tu peux aussi essayer de le supprimer de l'index depuis Webmaster tools, mais j'ignore si ce sera permanent.
Juste pour rigoler, quelqu'un à déjà essayé d'interdire l'accès à son robots.txt depuis lui-même ?
Johann
-

WebRankInfo - Administrateur du site

- Messages: 18958
- Inscription: 19 Avr 2002
Re: Google indexe robots.txt
le pb est qu'on ne veut pas empêcher le crawler de consulter la page, mais l'empêcher de l'indexer
- Samantha66
- Nouveau WRInaute

- Messages: 13
- Inscription: 19 Aoû 2011
Re: Google indexe robots.txt
Merci pour vos réponses.
Je vais tester de le disallow dans le robots.txt
Sinon comment je peux faire pour trouver le lien par lequel il a été indexer ? J'ai déjà fais une liste des liens avec Xenu et aucune trace du robots.txt.
Je vais tester de le disallow dans le robots.txt
Sinon comment je peux faire pour trouver le lien par lequel il a été indexer ? J'ai déjà fais une liste des liens avec Xenu et aucune trace du robots.txt.
-

WebRankInfo - Administrateur du site

- Messages: 18958
- Inscription: 19 Avr 2002
Re: Google indexe robots.txt
il te reste à lancer Xenu sur tout le reste du web pour trouver le fautif 
-

Tigerfou - WRInaute discret

- Messages: 186
- Inscription: 16 Juin 2011
Re: Google indexe robots.txt
Je crois que tu peux dire merci à woorank :
http://lmgtfy.com/?q=%22http%3A%2F%2Fwww.pompes-direct.com%2Frobots.txt%22
Bon courage pour te débarrasser du lien... Ceci dit c'est pas dramatique qu'il soit indexé ton robots.txt. A moins qu'il cache une partie secrète de ton site
http://lmgtfy.com/?q=%22http%3A%2F%2Fwww.pompes-direct.com%2Frobots.txt%22
Bon courage pour te débarrasser du lien... Ceci dit c'est pas dramatique qu'il soit indexé ton robots.txt. A moins qu'il cache une partie secrète de ton site
- tendancefruit
- Nouveau WRInaute

- Messages: 1
- Inscription: 10 Oct 2011
Re: Google indexe robots.txt
Salut!
Il faut utiliser les X-Robots-Tag HTTP headers pour interdire l'indexation du fichier robots.txt.
Pour plus d'informations: http://code.google.com/web/controlcrawlindex/docs/robots_meta_tag.html (en anglais)
"The X-Robots-Tag can be used as an element of the HTTP header response for a given URL. Any directive that can used in an robots meta tag can also be specified as an X-Robots-Tag. Here's an example of an HTTP response with an X-Robots-Tag instructing crawlers not to index a page....."
Il n'y a pas d'autre solution.
Il faut utiliser les X-Robots-Tag HTTP headers pour interdire l'indexation du fichier robots.txt.
Pour plus d'informations: http://code.google.com/web/controlcrawlindex/docs/robots_meta_tag.html (en anglais)
"The X-Robots-Tag can be used as an element of the HTTP header response for a given URL. Any directive that can used in an robots meta tag can also be specified as an X-Robots-Tag. Here's an example of an HTTP response with an X-Robots-Tag instructing crawlers not to index a page....."
Il n'y a pas d'autre solution.
-

lunicrea - WRInaute impliqué

- Messages: 501
- Inscription: 30 Aoû 2010
Re: Google indexe robots.txt
Ok d'accord ... c'est donc woorank qui m'a fait cette farce aussi !
D'ailleurs, je vois plein de sites très bizarres en rapport avec le nom de ma société, exemple :
Capture d'écran des 2 sites + le fameux woorank
On peut voir que pour les 2 premiers, ce sont apparemment une copie pure et simple des pages YouTube ...
Bon ben j'ai modifié mon .htaccess en fonction donc on verra bien ! merci pour le lien !
D'ailleurs, je vois plein de sites très bizarres en rapport avec le nom de ma société, exemple :
Capture d'écran des 2 sites + le fameux woorank
On peut voir que pour les 2 premiers, ce sont apparemment une copie pure et simple des pages YouTube ...
tendancefruit a écrit:Il n'y a pas d'autre solution.
Bon ben j'ai modifié mon .htaccess en fonction donc on verra bien ! merci pour le lien !
- Code: Tout sélectionner
<Files ~ "robots\.txt$">
Header set X-Robots-Tag "noindex"
</Files>
-

WebRankInfo - Administrateur du site

- Messages: 18958
- Inscription: 19 Avr 2002
Re: Google indexe robots.txt
Oui tendancefruit je pense que tu as raison... j'y avais pensé mais je ne l'ai jamais testé pour un fichier robots.txt ! pour ceux qui veulent des explications en français : l'entête X-Robots-Tag
ça veut dire qu'il faut gérer le fichier robots.txt par un script serveur qui rajoute l'entête HTTP ? et donc faire de la réécriture d'URL du fichier robots.txt ? Les petits malins découvriront peut-être qu'on peut faire du cloaking sur le fichier robots.txt
Edit : merci lunicrea pour le code .htaccess, c'est sans doute le plus simple effectivement
ça veut dire qu'il faut gérer le fichier robots.txt par un script serveur qui rajoute l'entête HTTP ? et donc faire de la réécriture d'URL du fichier robots.txt ? Les petits malins découvriront peut-être qu'on peut faire du cloaking sur le fichier robots.txt
Edit : merci lunicrea pour le code .htaccess, c'est sans doute le plus simple effectivement
- Samantha66
- Nouveau WRInaute

- Messages: 13
- Inscription: 19 Aoû 2011
Re: Google indexe robots.txt
Un grand merci (en retard) à tous pour vos réponses !
18 messages
• Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Tester l'indexation récente d'un site dans Google
Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

