robots.txt tout disallow sauf page accueil ?

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics


screuscreu
WRInaute impliqué
WRInaute impliqué
 
Messages: 968
Inscription: 14 Jan 2008

robots.txt tout disallow sauf page accueil ?

Message le Dim Fév 01, 2009 7:01

Bonjour,
J'ai pas trouvé la solution ici et ailleurs alors je la pose :
J'aimerais réussir à bloquer googlebot de partout sur mon site SAUF 1 dossier (que j'appellerai "google") et ma page d'accueil

Donc j'ai ça :
Code: Tout sélectionner
User-Agent: *
Allow: /google/
Disallow: /


Comment rajouter d'autoriser ma page d'accueil (qui est juste http://www.example.com/) sans rentrer en conflit avec "Disallow: /"

Merci d'avance pour vos lumières,
Screu


screuscreu
WRInaute impliqué
WRInaute impliqué
 
Messages: 968
Inscription: 14 Jan 2008

Re: robots.txt tout disallow sauf page accueil ?

Message le Lun Fév 02, 2009 8:33

Vraiment personne ?

J'ai une idée, dites moi ce que vous en pensez :

Je change tous mes liens qui pointent sur www.example.com sur www.example.com/index
et j'autorise le /index dans le robots.txt

Vous en pensez quoi ?
Mon problème est que tous mes liens externes qui pointaient sur www.example.com sont "faux", y a t'il moyen de rediriger dans le htacces vers /index uniquement la racine ? (je suis pas très competant en htaccess)

Merci,
Screu


HawkEye
WRInaute accro
WRInaute accro
 
Messages: 17013
Inscription: 23 Fév 2004

Re: robots.txt tout disallow sauf page accueil ?

Message le Lun Fév 02, 2009 11:51

Tu veux obligatoirement gérer ça par robots.txt ?
Ce n'est pas plus simple pour toi de conditionner ça dans ton script et d'envoyer un <meta name="robots" content="noindex, norachive" /> ?


screuscreu
WRInaute impliqué
WRInaute impliqué
 
Messages: 968
Inscription: 14 Jan 2008

Re: robots.txt tout disallow sauf page accueil ?

Message le Lun Fév 02, 2009 18:35

HawkEye a écrit:Tu veux obligatoirement gérer ça par robots.txt ?
Ce n'est pas plus simple pour toi de conditionner ça dans ton script et d'envoyer un <meta name="robots" content="noindex, norachive" /> ?

Merci pour ta réponse,

Non, j'aimerais vraiment de faire ça dans le robots.txt

Si c'est pas possible ... tant pis !


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: 3 Mai 2004

Re: robots.txt tout disallow sauf page accueil ?

Message le Lun Fév 02, 2009 19:44

screuscreu a écrit:J'aimerais réussir à bloquer googlebot de partout sur mon site SAUF 1 dossier (que j'appellerai "google") et ma page d'accueil

Il vaut mieux ne jamais utiliser "Allow" qui n'est pas standard. La solution conforme au standard, c'est:
Code: Tout sélectionner
User-Agent: *
Disallow: /repertoire1/
Disallow: /repertoire2/
Disallow: /repertoire3/
Disallow: /repertoire4/
Disallow: /fichier1
Disallow: /fichier2
Disallow: /fichier3
où repertoire1, repertoire2,..., fichier1, fichier2,... sont les répertoires et fichiers interdits d'accès. En gros, ça veut dire qu'il y aura une ligne par répertoire ou fichier interdit.

Jean-Luc


screuscreu
WRInaute impliqué
WRInaute impliqué
 
Messages: 968
Inscription: 14 Jan 2008

Re: robots.txt tout disallow sauf page accueil ?

Message le Mar Fév 03, 2009 22:35

Merci pour vos réponses.
J'utilise actuellement la méthode de jeanluc mais j'avais pour but de réduire la taille de ce fichier ... mais apparemment je ne pourrais pas comme cela ;)


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités