robots.txt exclure tous les spiders sauf les plus gros

Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics


ricoftb
WRInaute discret
WRInaute discret
 
Messages: 106
Inscription: 20 Fév 2007

robots.txt exclure tous les spiders sauf les plus gros

Message le Dim Juil 22, 2007 15:39

Comment ecrire un robots.txt qui exclure tous les spiders sauf les plus gros google, adsense, yahoo, msn, exalead, technorati ?

j'ai vu cette procedure expliquée dans http://www.webrankinfo.com/forums/viewtopic_4942.htm, mais ca me parait bizarre d'utiliser .htaccess

C'est vrai que j'ai toujours autorisé les robots à visiter mes sites, mais la le serveur est un peu faible et ils me font travailler le CPU au détriment des utilisateurs...

Il faudrait utiliser

User-Agent: nomDuRobot
Disallow :

pour les robots que j'ai cité, et sans doute d'autres pas trop "nuisible"

padawan2
WRInaute impliqué
WRInaute impliqué
 
Messages: 590
Inscription: 2 Fév 2007

Message le Dim Juil 22, 2007 16:25

Le fichier robots.txt n'est qu'une indication.
Il n'empêche l'accès qu'aux robots qui respectent ces règles.

Si tu veux vraiment empêcher certains robots d'accéder à ton site il te faut un fichier htaccess.


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par les experts Google Analytics de Ranking Metrics.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités