robots.txt sur un sous domaine. Comment faire?
14 messages
• Page 1 sur 1
- atbm
- WRInaute discret

- Messages: 170
- Inscription: 7 Fév 2005
robots.txt sur un sous domaine. Comment faire?
Bonjour.
J'ai un fichier robots.txt sur mon serveur (à la racine).
J'ai plusieurs dossiers placés à la racine de mon site, dont UN qui contient l'index d'un sous-domaine.
Quand on tape l'URL de mon sous-domaine: mag.monsite.com, on arrive directement dans le dossier qui contient le fichier "index" du sous-domaine.
Mon fichier robots.txt principal, donne donc des indications pour le site principal, mais je n'ai pas de fichier robots.txt pour le sous domaine.
Mes questions sont :
1.
"Puis-je placer un robots.txt dans le dossier où j'ai mis l'index du sous-domaine? Peut-on considérer dans ce cas précis que le dossier en question correspond à la racine du sous-domaine???
2. Si oui :
Si je veux interdire l'accès à certains dossiers, dois-je utiliser un chemin qui permet de sortir de ce dossier pour interdire les autres?
Pas clair???
Exemple:
Mon fichier robots.txt principal indique ceci:
User-agent: *
Disallow: /asie/
Si je place un second robots.txt dans un dossier nommé "magazine", là où est l'index du sous domaine...si je veux interdire le même dossier "asie", est-il possible de faire comme pour le chemin d'un fichier:
User-agent: *
Disallow: .../asie/
les petits points indiquant qu'il faut sortir du dossier où est le robots.txt pour trouver le dossier "asie"...
Et combien de points ? 2 ou 3?
Si ce n'est pas possible, quelle solution ai-je pour mettre un robots.txt sur mon sous-domaine, en conservant le robots.txt principal à la racine???
Merci d'avance...
J'ai un fichier robots.txt sur mon serveur (à la racine).
J'ai plusieurs dossiers placés à la racine de mon site, dont UN qui contient l'index d'un sous-domaine.
Quand on tape l'URL de mon sous-domaine: mag.monsite.com, on arrive directement dans le dossier qui contient le fichier "index" du sous-domaine.
Mon fichier robots.txt principal, donne donc des indications pour le site principal, mais je n'ai pas de fichier robots.txt pour le sous domaine.
Mes questions sont :
1.
"Puis-je placer un robots.txt dans le dossier où j'ai mis l'index du sous-domaine? Peut-on considérer dans ce cas précis que le dossier en question correspond à la racine du sous-domaine???
2. Si oui :
Si je veux interdire l'accès à certains dossiers, dois-je utiliser un chemin qui permet de sortir de ce dossier pour interdire les autres?
Pas clair???
Exemple:
Mon fichier robots.txt principal indique ceci:
User-agent: *
Disallow: /asie/
Si je place un second robots.txt dans un dossier nommé "magazine", là où est l'index du sous domaine...si je veux interdire le même dossier "asie", est-il possible de faire comme pour le chemin d'un fichier:
User-agent: *
Disallow: .../asie/
les petits points indiquant qu'il faut sortir du dossier où est le robots.txt pour trouver le dossier "asie"...
Et combien de points ? 2 ou 3?
Si ce n'est pas possible, quelle solution ai-je pour mettre un robots.txt sur mon sous-domaine, en conservant le robots.txt principal à la racine???
Merci d'avance...
-

Patrice A. - WRInaute passionné

- Messages: 2415
- Inscription: 11 Fév 2005
Re: robots.txt sur un sous domaine. Comment faire?
atbm a écrit:Bonjour.
Bonjour,
1.
"Puis-je placer un robots.txt dans le dossier où j'ai mis l'index du sous-domaine? Peut-on considérer dans ce cas précis que le dossier en question correspond à la racine du sous-domaine???
Oui.
2. Si oui :
Si je veux interdire l'accès à certains dossiers, dois-je utiliser un chemin qui permet de sortir de ce dossier pour interdire les autres?
Pas clair???
Non. Tu ne peux pas demander à un robot qui visite (exemple) monblog.monhebergeur.com
de ne pas aller voir
autreblog.monhebergeur.com/photos/
(ce n'est pas le même site !!)
- atbm
- WRInaute discret

- Messages: 170
- Inscription: 7 Fév 2005
Merci de la réponse.
En résumé, si j'ai bien compris:
Il est donc possible de mettre deux robots.txt dans ces conditions:
Un à la racine du site : www.example.com
Un dans le dossier où est l'index du sous-domaine : www.example.com/magazine
je suis assurée qu'ils ne feront pas interférence entre eux,
puisqu'on considère que ce sont deux sites différents...
Cela signifie aussi que les robots qui arrivent directement dans www.example.com/magazine
par le biais de l'URL de mon sous-domaine, ne peuvent en aucun cas aller voir dans les autres dossiers du genre www.example.com/asie...
En fait ils ne peuvent que descendre plus bas dans la hiérarchie:
www.example.com/magazine/autredossier....etc...
C'est bien ça???
En résumé, si j'ai bien compris:
Il est donc possible de mettre deux robots.txt dans ces conditions:
Un à la racine du site : www.example.com
Un dans le dossier où est l'index du sous-domaine : www.example.com/magazine
je suis assurée qu'ils ne feront pas interférence entre eux,
puisqu'on considère que ce sont deux sites différents...
Cela signifie aussi que les robots qui arrivent directement dans www.example.com/magazine
par le biais de l'URL de mon sous-domaine, ne peuvent en aucun cas aller voir dans les autres dossiers du genre www.example.com/asie...
En fait ils ne peuvent que descendre plus bas dans la hiérarchie:
www.example.com/magazine/autredossier....etc...
C'est bien ça???
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Encore une précision : si tu crains que les robots découvrent "quelque part" l'adresse www.monsite.com/magazine/, tu peux mettre un disallow la concernant dans le robots.txt à la racine de www.monsite.com. Ceci évitera une double indexation (nuisible) des pages du sous-domaine magazine.monsite.com.
Jean-Luc
Jean-Luc
-

Patrice A. - WRInaute passionné

- Messages: 2415
- Inscription: 11 Fév 2005
Quel est exactement ton objectif avec ceci ?
- Code: Tout sélectionner
User-agent: *
Disallow:
- atbm
- WRInaute discret

- Messages: 170
- Inscription: 7 Fév 2005
C'est juste d'avoir un robots.txt pour mon sous-domaine, parce qu'autrement j'ai sans arrêt des échecs d'accès au robots.txt dans mes stats.
Donc ce robots.txt autorise tous les robots à tout voir.. en fait, il n'y a rien à voir car dans ce dossier je n'ai que l'index du sous-domaine et un ascreen.
L'index du sous-domaine permet ensuite l'affichage de tout mon site par une frame invisible (100%) que j'ai créée moi même, avec liens pour les moteurs (ça marche, j'ai vérifié avec spider simulator)...
Le reste de mon site est stocké sur wanadoo...
A ce propos, j'ai une question:
Les robots suivent les liens et indexent le reste de mon site...
Mais j'ai d'autres dossiers stockés sur wanadoo sans aucun lien avec mon site... Pensez-vous que les robots puissent indexer ces dossiers (ce que je ne souhaite pas)
Donc ce robots.txt autorise tous les robots à tout voir.. en fait, il n'y a rien à voir car dans ce dossier je n'ai que l'index du sous-domaine et un ascreen.
L'index du sous-domaine permet ensuite l'affichage de tout mon site par une frame invisible (100%) que j'ai créée moi même, avec liens pour les moteurs (ça marche, j'ai vérifié avec spider simulator)...
Le reste de mon site est stocké sur wanadoo...
A ce propos, j'ai une question:
Les robots suivent les liens et indexent le reste de mon site...
Mais j'ai d'autres dossiers stockés sur wanadoo sans aucun lien avec mon site... Pensez-vous que les robots puissent indexer ces dossiers (ce que je ne souhaite pas)
-

Patrice A. - WRInaute passionné

- Messages: 2415
- Inscription: 11 Fév 2005
S'il y a quelque part sur internet des liens vers ces dossiers, tu devines la réponse.
S'il n'y a aucun lien nulle part, tu devines aussi
S'il n'y a aucun lien nulle part, tu devines aussi
- atbm
- WRInaute discret

- Messages: 170
- Inscription: 7 Fév 2005
En fait, un robot qui arrive à la racine d'un site (là je ne parle plus de sous-domaine), que fait-il ?
- Il visite tous les dossiers qu'il trouve (sauf ceux interdits par le robots.txt, évidemment) ?
- ou bien il suit les liens inscrits dans l'index placé à la racine du site ?
- Il visite tous les dossiers qu'il trouve (sauf ceux interdits par le robots.txt, évidemment) ?
- ou bien il suit les liens inscrits dans l'index placé à la racine du site ?
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Pour répondre à ta question, on peut dire qu'un robot ne connait pas la notion de dossier, qu'il se contente de la notion de lien.
Concernant ton message précédent, tes dossiers perso seraient peut-être mieux ailleurs que dans des pages dont il suffit de connaître l'adresse pour pouvoir les afficher (d'après ce que tu dis). Les adresses de pages se perdent toujours à gauche ou a droite (referrers, cache du navigateur, adresse lue par dessus ton épaule,...).
Jean-Luc
Concernant ton message précédent, tes dossiers perso seraient peut-être mieux ailleurs que dans des pages dont il suffit de connaître l'adresse pour pouvoir les afficher (d'après ce que tu dis). Les adresses de pages se perdent toujours à gauche ou a droite (referrers, cache du navigateur, adresse lue par dessus ton épaule,...).
Jean-Luc
14 messages
• Page 1 sur 1
Lectures recommandées sur ce thème :
- Interdire certains robots ? Comment ? Quels robots ?
- domaine en .com redirection et robots
- Robots.txt et sous domaine
- Robots.txt et son domaine d'application
- robots.txt pour un sous-domaine
- suppression sous domaine avec robots.txt
- Ou mettre le Robots.txt pour un sous domaine ?
- Pas de fichier robots.txt pour le domaine
- Baisse du nombre de visites de robots : comment expliquer ... ?
- comment suivre et analyser les visites robots
- Petit changement pour Slurp (le robot de Yahoo) - 29-03-2007
- Sortie de GoogleStats v2.01 - 02-03-2003
- Comment éviter de se faire voler son nom de domaine... - 21-03-2008
- Les crawlers de Yahoo! - 18-03-2004
- Comment gérer simplement les sitemaps de plusieurs sites au même endroit - 28-02-2008
- Les robots MSNbot de Live Search - 30-11-2006
- Déclarer son fichier sitemap dans le fichier robots.txt - 16-04-2007
- La balise meta NOYDIR de Yahoo - 05-03-2007
Consultez la description détaillée des produits ou services de Google suivants : Google Apps for your Domain, Google Apps Edition Premium
- Les sous-domaines d'un site
Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
