optimisation robots.txt

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


Leonick
WRInaute accro
WRInaute accro
 
Messages: 12164
Inscription: Dim Aoû 08, 2004 20:24

optimisation robots.txt

Message le Mer Fév 11, 2009 16:55

Bonjour,

Dans le cadre de l'optimisation aux accès sur mes sites, voilà mon fichier robots.txt
Code: Tout sélectionner
# debut filtrage
User-agent: *
Disallow: /

User-agent: Googlebot
User-agent: Mediapartners-Google
User-agent: Googlebot-Mobile
User-agent: googlebot-Image
User-agent: ng
User-agent: exabot
User-agent: msnbot
User-agent: Teoma
User-agent: voila
User-agent: Slurp
Disallow: /apropos
Disallow: /contact
Disallow: /soumission*
Disallow: /confirmation*
# fin filtrage
Disallow: /*.pdf
Disallow: /*.doc
Est-ce que ce robots.txt est bien sensé ne pas permettre l'accès à tous les robots sauf ceux dans la liste ?


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2651
Inscription: Lun Mai 03, 2004 14:48

Re: optimisation robots.txt

Message le Mer Fév 11, 2009 17:09

Exact.

Mais il vaudrait mieux supprimer les deux * en fin de ligne devant # fin filtrage. C'est non standard et cela ne sera pas compris par certains robots.

Jean-Luc


Leonick
WRInaute accro
WRInaute accro
 
Messages: 12164
Inscription: Dim Aoû 08, 2004 20:24

Re: optimisation robots.txt

Message le Mer Fév 11, 2009 17:35

si j'enlève le * à soumettre, tous les robots (autorisés) vont bien comprendre qu'il ne faut pas indexer soumettre_cat1, soumettre_cat2, etc... ?


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2651
Inscription: Lun Mai 03, 2004 14:48

Re: optimisation robots.txt

Message le Mer Fév 11, 2009 18:21

Yes. :wink:

Jean-Luc


Leonick
WRInaute accro
WRInaute accro
 
Messages: 12164
Inscription: Dim Aoû 08, 2004 20:24

Re: optimisation robots.txt

Message le Mer Fév 11, 2009 19:07

Normalement, ia_archiver (+http://www.alexa.com/site/help/webmasters; crawler@alexa.com) aurait dû comprendre que je ne veut pas de lui sur mon serveur, non ?


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2651
Inscription: Lun Mai 03, 2004 14:48

Re: optimisation robots.txt

Message le Mer Fév 11, 2009 19:55

Oui, il est interdit par le robots.txt que tu as copié dans ton message.

Jean-Luc


Leonick
WRInaute accro
WRInaute accro
 
Messages: 12164
Inscription: Dim Aoû 08, 2004 20:24

Re: optimisation robots.txt

Message le Mer Fév 11, 2009 20:08

Bon ben je crois que je vais sortir une liste des robots qui ne respectent pas les robots.txt des sites :evil:


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15808
Inscription: Ven Avr 19, 2002 19:51

Re: optimisation robots.txt

Message le Jeu Fév 12, 2009 10:17

as-tu essayé l'outil fourni par Google Webmaster Tools pour analyser ton robots.txt ?


Leonick
WRInaute accro
WRInaute accro
 
Messages: 12164
Inscription: Dim Aoû 08, 2004 20:24

Re: optimisation robots.txt

Message le Jeu Fév 12, 2009 11:52

Oui, mais je me demandais si les autres robots le comprenaient de la même façon. D'autant plus qu'au début, je n'avais pas ajouté correctement Mediapartners et je m'en suis aperçu très rapidement, en voyant que mes adsenses ne s'affichaient plus sur un site, au fur et à mesure des tentatives de crawl.

Sinon, j'ai un nouveau robot de chez microsoft MSR-ISRCCrawler qui ne tient pas compte du robots.txt et essaie de crawler ponctuellement. L'ip appartient bien à microsoft, mais le host renvoyé ne comprend pas microsoft

Heureusement que j'ai d'autres blocages en plus de robots.txt. L'étape suivante va consister à bloquer ces robots ou blocs d'ip directement dans le htaccess, mais d'automatiser cette mise à jour pour tous mes sites via mon interface admin de chaque site.


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2651
Inscription: Lun Mai 03, 2004 14:48

Re: optimisation robots.txt

Message le Jeu Fév 12, 2009 12:19

Leonick a écrit:Oui, mais je me demandais si les autres robots le comprenaient de la même façon.

L'outil Google est utile, mais il ne montre que l'interprétation du fichier par Google et, comme Google accepte des directives non standard, le diagnostic donné par l'outil n'est pas nécessairement correct pour les autres robots.

Jean-Luc

gorchfock
WRInaute passionné
WRInaute passionné
 
Messages: 593
Inscription: Lun Oct 23, 2006 20:31

Re: optimisation robots.txt

Message le Jeu Avr 30, 2009 22:06

On est sur du bon sens des directives ?
Je le demande car il me parait bizarre ce robots.txt

# debut filtrage
User-agent: *
Disallow: /

User-agent: Googlebot
User-agent: Mediapartners-Google
User-agent: Googlebot-Mobile
User-agent: googlebot-Image
User-agent: ng
User-agent: exabot
User-agent: msnbot
User-agent: Teoma
User-agent: voila
User-agent: Slurp
Disallow: /apropos
Disallow: /contact
Disallow: /soumission*
Disallow: /confirmation*
# fin filtrage
Disallow: /*.pdf
Disallow: /*.doc


Moi j'ai plutôt ceci chez moi :


# filtrage des User non autorisé sur tout le site
User-agent: Art-Online
User-agent: findlinks
User-agent: psbot
User-agent: onCHECK-Robot
User-agent: NimbleCrawler
User-agent: Krugle
User-agent: voyager
User-agent: cfetch
User-agent: IRLbot
User-agent: MJ12bot
User-agent: NG/2.0
User-agent: e-SocietyRobot
User-agent: baiduspider
User-agent: sohu agent
User-agent: sohu-search
User-agent: sogou spider
User-agent: Vagabondo
User-Agent: psycheclone
User-Agent: SurveyBot/2.3
User-Agent: SBIder/0.8-dev
User-Agent: aipbot/1.0
User-Agent: OmniExplorer_Bot
User-Agent: page-store
User-Agent: twiceler
Disallow: /

# Les autres
User-agent: *
Disallow: /projet_martinique/
Disallow: /images/soirees/
Disallow: /maquette/
Disallow: /paroles/
Disallow: /affiche_concert/
Disallow: /photos_bienvenue/


Dans ton cas moi j'aurai inversé ceci :


# debut filtrage
User-agent: Googlebot
User-agent: Mediapartners-Google
User-agent: Googlebot-Mobile
User-agent: googlebot-Image
User-agent: ng
User-agent: exabot
User-agent: msnbot
User-agent: Teoma
User-agent: voila
User-agent: Slurp
Disallow: /apropos
Disallow: /contact
Disallow: /soumission*
Disallow: /confirmation*

User-agent: *
Disallow: /

# fin filtrage
Disallow: /*.pdf
Disallow: /*.doc



Je ne sais pas si ça à une importance l'ordre. Je me pose donc la question 8)


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2651
Inscription: Lun Mai 03, 2004 14:48

Re: optimisation robots.txt

Message le Sam Mai 02, 2009 12:54

Tes exemples 1 et 2 sont équivalents. L'ordre des interdictions n'a pas d'importance.

Ton exemple 3 n'est pas correct: la ligne vide avant le commentaire # fin filtrage n'est pas autorisée, car elle se trouve à l'intérieur d'une série d'interdictions.

Jean-Luc


GUITEL
WRInaute impliqué
WRInaute impliqué
 
Messages: 496
Inscription: Ven Juin 08, 2007 8:57

Re: optimisation robots.txt

Message le Sam Mai 02, 2009 13:20

@ Leonick

Tu as eu l'idee de faire ce test à partir de ce post, ( http://forum.webrankinfo.com/robots-txt-sitemap-est-qui-qui-gagne-t109815.html ) ou c'est une coincidence ?


Leonick
WRInaute accro
WRInaute accro
 
Messages: 12164
Inscription: Dim Aoû 08, 2004 20:24

Re: optimisation robots.txt

Message le Sam Mai 02, 2009 14:54

GUITEL a écrit:@ Leonick

Tu as eu l'idee de faire ce test à partir de ce post, ( http://forum.webrankinfo.com/robots-txt-sitemap-est-qui-qui-gagne-t109815.html ) ou c'est une coincidence ?
mon post date de 2 mois auparavant :lol:

gorchfock
WRInaute passionné
WRInaute passionné
 
Messages: 593
Inscription: Lun Oct 23, 2006 20:31

Re: optimisation robots.txt

Message le Sam Mai 02, 2009 18:17

jeanluc a écrit:Tes exemples 1 et 2 sont équivalents. L'ordre des interdictions n'a pas d'importance.

Ton exemple 3 n'est pas correct: la ligne vide avant le commentaire # fin filtrage n'est pas autorisée, car elle se trouve à l'intérieur d'une série d'interdictions.

Jean-Luc


Merci Jeanluc, donc si je retire la ligne vide en question l'exemple 3 deviendrait correct ?

En tout cas si les 2 premiers sont équivalents c'est tant mieux :D

optimisation robots.txt

Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités