Robots utiles et robots inutiles
3 messages • Page 1 sur 1
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
Robots utiles et robots inutiles
Qui pourrait me donner une liste (et son .htaccess ou son robots.txt) pour avoir une liste de robots utiles excluant les robots inutiles ?
Evidemment la qualification utile/inutile est très subjective... mais disont que les robots inutiles sont ceux qui s'appellent : je-pompe-ton-contenu-pour-l'agréger-sur-mes-super-sites-made-for adsense-et-je-dit-meme-pas-merci-en-plus-je-bouffe-ta-bande-passante...
voyez le genre...

Evidemment la qualification utile/inutile est très subjective... mais disont que les robots inutiles sont ceux qui s'appellent : je-pompe-ton-contenu-pour-l'agréger-sur-mes-super-sites-made-for adsense-et-je-dit-meme-pas-merci-en-plus-je-bouffe-ta-bande-passante...
voyez le genre...
- bozoleclown
- WRInaute passionné

- Messages: 893
- Inscription: Jeu Nov 24, 2005 19:08
les sites qui pompent ton contenu ne regardent pas ton robots.txt et se fondent dans la masse avec un useragent standard
Donc faut bloquer les ip
Donc faut bloquer les ip
pour cela, tu fais un lien sur la page d'accueil, qui va envoyer sur une page bloquée dans le robots.txt, et ensuite, tu bloques toutes les ip de ceux qui arrivent sur cette page.
Attente un petit temps, histoire que le robots.txt ait bien été mis à jour sur tous les spiders et tous les DC
Attente un petit temps, histoire que le robots.txt ait bien été mis à jour sur tous les spiders et tous les DC
3 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par Julien Coquet, expert certifié officiellement par Google Analytics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Sortie de GoogleStats v2.01
- Les crawlers de Yahoo!
- Les robots MSNbot de Live Search
- Déclarer son fichier sitemap dans le fichier robots.txt
- Petit changement pour Slurp (le robot de Yahoo)
- Des informations sur l'algorithme de Yahoo Search fournies par Priyank Garg
- Robots.txt : Yahoo supporte les options avancées
- La balise meta NOYDIR de Yahoo
- Nouvelle version de GoogleStats : v1.1
- Référencement d'un forum phpBB
Consultez la description détaillée des produits ou services de Google suivants : Google Feed Fetcher
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités




le forum