robots.txt sur un sous domaine. Comment faire?
14 messages • Page 1 sur 1
robots.txt sur un sous domaine. Comment faire?
Bonjour.
J'ai un fichier robots.txt sur mon serveur (à la racine).
J'ai plusieurs dossiers placés à la racine de mon site, dont UN qui contient l'index d'un sous-domaine.
Quand on tape l'URL de mon sous-domaine: mag.monsite.com, on arrive directement dans le dossier qui contient le fichier "index" du sous-domaine.
Mon fichier robots.txt principal, donne donc des indications pour le site principal, mais je n'ai pas de fichier robots.txt pour le sous domaine.
Mes questions sont :
1.
"Puis-je placer un robots.txt dans le dossier où j'ai mis l'index du sous-domaine? Peut-on considérer dans ce cas précis que le dossier en question correspond à la racine du sous-domaine???
2. Si oui :
Si je veux interdire l'accès à certains dossiers, dois-je utiliser un chemin qui permet de sortir de ce dossier pour interdire les autres?
Pas clair???
Exemple:
Mon fichier robots.txt principal indique ceci:
User-agent: *
Disallow: /asie/
Si je place un second robots.txt dans un dossier nommé "magazine", là où est l'index du sous domaine...si je veux interdire le même dossier "asie", est-il possible de faire comme pour le chemin d'un fichier:
User-agent: *
Disallow: .../asie/
les petits points indiquant qu'il faut sortir du dossier où est le robots.txt pour trouver le dossier "asie"...
Et combien de points ? 2 ou 3?
Si ce n'est pas possible, quelle solution ai-je pour mettre un robots.txt sur mon sous-domaine, en conservant le robots.txt principal à la racine???
Merci d'avance...
J'ai un fichier robots.txt sur mon serveur (à la racine).
J'ai plusieurs dossiers placés à la racine de mon site, dont UN qui contient l'index d'un sous-domaine.
Quand on tape l'URL de mon sous-domaine: mag.monsite.com, on arrive directement dans le dossier qui contient le fichier "index" du sous-domaine.
Mon fichier robots.txt principal, donne donc des indications pour le site principal, mais je n'ai pas de fichier robots.txt pour le sous domaine.
Mes questions sont :
1.
"Puis-je placer un robots.txt dans le dossier où j'ai mis l'index du sous-domaine? Peut-on considérer dans ce cas précis que le dossier en question correspond à la racine du sous-domaine???
2. Si oui :
Si je veux interdire l'accès à certains dossiers, dois-je utiliser un chemin qui permet de sortir de ce dossier pour interdire les autres?
Pas clair???
Exemple:
Mon fichier robots.txt principal indique ceci:
User-agent: *
Disallow: /asie/
Si je place un second robots.txt dans un dossier nommé "magazine", là où est l'index du sous domaine...si je veux interdire le même dossier "asie", est-il possible de faire comme pour le chemin d'un fichier:
User-agent: *
Disallow: .../asie/
les petits points indiquant qu'il faut sortir du dossier où est le robots.txt pour trouver le dossier "asie"...
Et combien de points ? 2 ou 3?
Si ce n'est pas possible, quelle solution ai-je pour mettre un robots.txt sur mon sous-domaine, en conservant le robots.txt principal à la racine???
Merci d'avance...
-

Patrice A. - Modérateur

- Messages: 2413
- Inscription: Ven Fév 11, 2005 19:36
Re: robots.txt sur un sous domaine. Comment faire?
atbm a écrit:Bonjour.
Bonjour,
1.
"Puis-je placer un robots.txt dans le dossier où j'ai mis l'index du sous-domaine? Peut-on considérer dans ce cas précis que le dossier en question correspond à la racine du sous-domaine???
Oui.
2. Si oui :
Si je veux interdire l'accès à certains dossiers, dois-je utiliser un chemin qui permet de sortir de ce dossier pour interdire les autres?
Pas clair???
Non. Tu ne peux pas demander à un robot qui visite (exemple) monblog.monhebergeur.com
de ne pas aller voir
autreblog.monhebergeur.com/photos/
(ce n'est pas le même site !!)
Merci de la réponse.
En résumé, si j'ai bien compris:
Il est donc possible de mettre deux robots.txt dans ces conditions:
Un à la racine du site : www.example.com
Un dans le dossier où est l'index du sous-domaine : www.example.com/magazine
je suis assurée qu'ils ne feront pas interférence entre eux,
puisqu'on considère que ce sont deux sites différents...
Cela signifie aussi que les robots qui arrivent directement dans www.example.com/magazine
par le biais de l'URL de mon sous-domaine, ne peuvent en aucun cas aller voir dans les autres dossiers du genre www.example.com/asie...
En fait ils ne peuvent que descendre plus bas dans la hiérarchie:
www.example.com/magazine/autredossier....etc...
C'est bien ça???
En résumé, si j'ai bien compris:
Il est donc possible de mettre deux robots.txt dans ces conditions:
Un à la racine du site : www.example.com
Un dans le dossier où est l'index du sous-domaine : www.example.com/magazine
je suis assurée qu'ils ne feront pas interférence entre eux,
puisqu'on considère que ce sont deux sites différents...
Cela signifie aussi que les robots qui arrivent directement dans www.example.com/magazine
par le biais de l'URL de mon sous-domaine, ne peuvent en aucun cas aller voir dans les autres dossiers du genre www.example.com/asie...
En fait ils ne peuvent que descendre plus bas dans la hiérarchie:
www.example.com/magazine/autredossier....etc...
C'est bien ça???
Encore une précision : si tu crains que les robots découvrent "quelque part" l'adresse www.monsite.com/magazine/, tu peux mettre un disallow la concernant dans le robots.txt à la racine de www.monsite.com. Ceci évitera une double indexation (nuisible) des pages du sous-domaine magazine.monsite.com.
Jean-Luc
Jean-Luc
-

Patrice A. - Modérateur

- Messages: 2413
- Inscription: Ven Fév 11, 2005 19:36
Quel est exactement ton objectif avec ceci ?
- Code: Tout sélectionner
User-agent: *
Disallow:
C'est juste d'avoir un robots.txt pour mon sous-domaine, parce qu'autrement j'ai sans arrêt des échecs d'accès au robots.txt dans mes stats.
Donc ce robots.txt autorise tous les robots à tout voir.. en fait, il n'y a rien à voir car dans ce dossier je n'ai que l'index du sous-domaine et un ascreen.
L'index du sous-domaine permet ensuite l'affichage de tout mon site par une frame invisible (100%) que j'ai créée moi même, avec liens pour les moteurs (ça marche, j'ai vérifié avec spider simulator)...
Le reste de mon site est stocké sur wanadoo...
A ce propos, j'ai une question:
Les robots suivent les liens et indexent le reste de mon site...
Mais j'ai d'autres dossiers stockés sur wanadoo sans aucun lien avec mon site... Pensez-vous que les robots puissent indexer ces dossiers (ce que je ne souhaite pas)
Donc ce robots.txt autorise tous les robots à tout voir.. en fait, il n'y a rien à voir car dans ce dossier je n'ai que l'index du sous-domaine et un ascreen.
L'index du sous-domaine permet ensuite l'affichage de tout mon site par une frame invisible (100%) que j'ai créée moi même, avec liens pour les moteurs (ça marche, j'ai vérifié avec spider simulator)...
Le reste de mon site est stocké sur wanadoo...
A ce propos, j'ai une question:
Les robots suivent les liens et indexent le reste de mon site...
Mais j'ai d'autres dossiers stockés sur wanadoo sans aucun lien avec mon site... Pensez-vous que les robots puissent indexer ces dossiers (ce que je ne souhaite pas)
-

Patrice A. - Modérateur

- Messages: 2413
- Inscription: Ven Fév 11, 2005 19:36
S'il y a quelque part sur internet des liens vers ces dossiers, tu devines la réponse.
S'il n'y a aucun lien nulle part, tu devines aussi
S'il n'y a aucun lien nulle part, tu devines aussi
En fait, un robot qui arrive à la racine d'un site (là je ne parle plus de sous-domaine), que fait-il ?
- Il visite tous les dossiers qu'il trouve (sauf ceux interdits par le robots.txt, évidemment) ?
- ou bien il suit les liens inscrits dans l'index placé à la racine du site ?
- Il visite tous les dossiers qu'il trouve (sauf ceux interdits par le robots.txt, évidemment) ?
- ou bien il suit les liens inscrits dans l'index placé à la racine du site ?
Pour répondre à ta question, on peut dire qu'un robot ne connait pas la notion de dossier, qu'il se contente de la notion de lien.
Concernant ton message précédent, tes dossiers perso seraient peut-être mieux ailleurs que dans des pages dont il suffit de connaître l'adresse pour pouvoir les afficher (d'après ce que tu dis). Les adresses de pages se perdent toujours à gauche ou a droite (referrers, cache du navigateur, adresse lue par dessus ton épaule,...).
Jean-Luc
Concernant ton message précédent, tes dossiers perso seraient peut-être mieux ailleurs que dans des pages dont il suffit de connaître l'adresse pour pouvoir les afficher (d'après ce que tu dis). Les adresses de pages se perdent toujours à gauche ou a droite (referrers, cache du navigateur, adresse lue par dessus ton épaule,...).
Jean-Luc
14 messages • Page 1 sur 1
Lectures recommandées sur ce thème :
- Petit changement pour Slurp (le robot de Yahoo)
- Comment éviter de se faire voler son nom de domaine...
- Sortie de GoogleStats v2.01
- Les crawlers de Yahoo!
- Comment gérer simplement les sitemaps de plusieurs sites au même endroit
- Les robots MSNbot de Live Search
- Déclarer son fichier sitemap dans le fichier robots.txt
- Robots.txt : Yahoo supporte les options avancées
- La balise meta NOYDIR de Yahoo
- Comment faire ignorer des zones de page pour Yahoo (robots-nocontent)
- Interdire certains robots ? Comment ? Quels robots ?
- domaine en .com redirection et robots
- Robots.txt et sous domaine
- suppression sous domaine avec robots.txt
- Comment pointer un sous-domaine vers un domaine externe
- Ou mettre le Robots.txt pour un sous domaine ?
- Pas de fichier robots.txt pour le domaine
- Comment distinguer les robots des visiteurs ?
- Comment faire en sorte que les robots me visitent
- Fichier robots.txt dans un sous domaine : éclaircissement
- Passge des robots, comment les déclencher?
- Comment vérifier si une page est interdite aux robots !
- Probleme de robots.txt sur sous domaine : google index !!!!
- Robots.txt sur forum en sous domaine, j'ai bon ?
- Comment supprimer des pages de l'index MSN avec robots.txt?
Consultez la description détaillée des produits ou services de Google suivants : Google Apps for your Domain, Google Apps Edition Premium
- Les sous-domaines d'un site
Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités




le forum