robots.txt : interdire tout sauf la racine
5 messages • Page 1 sur 1
robots.txt : interdire tout sauf la racine
Bonjour,
Après avoir lu quelque part que nommer les dossiers à ne pas faire visiter aux robots dans le robots.txt revenait aussi à faciliter la recherche des dossiers "intéressants" aux "crackeurs" je me demande et cherche (en vain) s'il est possible d'interdire la visite de tous les dossiers d'un site sans les nommer tout en maintenant autorisés ceux présent en root.
en effet si je place l'instruction :
même les fichiers placés en root ne seront pas visités.
Une solution ? (Je ne parle pas du .htaccess)
Cordialement
Après avoir lu quelque part que nommer les dossiers à ne pas faire visiter aux robots dans le robots.txt revenait aussi à faciliter la recherche des dossiers "intéressants" aux "crackeurs" je me demande et cherche (en vain) s'il est possible d'interdire la visite de tous les dossiers d'un site sans les nommer tout en maintenant autorisés ceux présent en root.
en effet si je place l'instruction :
- Code: Tout sélectionner
Disallow: /
même les fichiers placés en root ne seront pas visités.
Une solution ? (Je ne parle pas du .htaccess)
Cordialement
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
-

carole heinz - WRInaute accro

- Messages: 2375
- Inscription: Mer Fév 28, 2007 2:44
Re: robots.txt : interdire tout sauf la racine
ajedt a écrit: (Je ne parle pas du .htaccess)
il faudrait pourtant
Tu pourrais mettre:
Si tu veux être plus discret et si tu es certain qu'il n'y a pas de confusion possible avec d'autres fichiers, tu peux mettre:
De cette façon, robots.txt n'indique plus les noms des répertoires et les robots malveillants n'y trouvent plus d'info utile.
Jean-Luc
- Code: Tout sélectionner
User-agent: *
Disallow: /repertoire1/
Disallow: /machin/
Disallow: /pas-touche/
Si tu veux être plus discret et si tu es certain qu'il n'y a pas de confusion possible avec d'autres fichiers, tu peux mettre:
- Code: Tout sélectionner
User-agent: *
Disallow: /reperto
Disallow: /mach
Disallow: /pas-tou
De cette façon, robots.txt n'indique plus les noms des répertoires et les robots malveillants n'y trouvent plus d'info utile.
Jean-Luc
-

Megachercheur - WRInaute impliqué

- Messages: 468
- Inscription: Sam Oct 23, 2004 17:45
Superbe astuce, Jean-Luc ! 
Modérateurs: HawkEye, WebRankInfo, e-kiwi
5 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- La balise meta NOYDIR de Yahoo
- Comment éviter les contenus dupliqués (avec/sans le www)
- Petit changement pour Slurp (le robot de Yahoo)
- Outil officiel de suppression de pages de l'index Google
- Déclarer son fichier sitemap dans le fichier robots.txt
- Sortie de GoogleStats v2.01
- Les crawlers de Yahoo!
- Les robots MSNbot de Live Search
- Où placer son fichier Sitemap ? A la racine ?
- Précisez vos recherches sur Google par la profondeur en répertoires
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités



le forum