robots.txt exclure tous les spiders sauf les plus gros
2 messages
• Page 1 sur 1
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
-

ricoftb - WRInaute discret

- Messages: 106
- Inscription: 20 Fév 2007
robots.txt exclure tous les spiders sauf les plus gros
Comment ecrire un robots.txt qui exclure tous les spiders sauf les plus gros google, adsense, yahoo, msn, exalead, technorati ?
j'ai vu cette procedure expliquée dans http://www.webrankinfo.com/forums/viewtopic_4942.htm, mais ca me parait bizarre d'utiliser .htaccess
C'est vrai que j'ai toujours autorisé les robots à visiter mes sites, mais la le serveur est un peu faible et ils me font travailler le CPU au détriment des utilisateurs...
Il faudrait utiliser
User-Agent: nomDuRobot
Disallow :
pour les robots que j'ai cité, et sans doute d'autres pas trop "nuisible"
j'ai vu cette procedure expliquée dans http://www.webrankinfo.com/forums/viewtopic_4942.htm, mais ca me parait bizarre d'utiliser .htaccess
C'est vrai que j'ai toujours autorisé les robots à visiter mes sites, mais la le serveur est un peu faible et ils me font travailler le CPU au détriment des utilisateurs...
Il faudrait utiliser
User-Agent: nomDuRobot
Disallow :
pour les robots que j'ai cité, et sans doute d'autres pas trop "nuisible"
2 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par les experts Google Analytics de Ranking Metrics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- des Robots/Spiders fous qui génère un trafic monstre
- Robots : exclure certains mots?
- Exclure les robots indésirable : 2 méthodes
- que faut il exclure avec le fichier robots.txt?
- Faut-il exclure le fichier index dans le robots.txt
- Exclure les robots des fichiers de log IIS
- exclure certaines pages contenant un mot avec robots.txt
- [regle] peut-on exclure les repertoires // dans robots.txt ?
- Robots.txt : Exclure toute page sauf "telles pages"
- Agents et Spiders
Consultez la description détaillée des produits ou services de Google suivants : JotSpot
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

