Bannir les crawls de particulier...
9 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Bannir les crawls de particulier...
Bonjour,
Depuis quelques jours une page particuliere de mon site est crawlé toute les 6 secondes par un energumene sans gene !!!!
Je me doutais que cela arriverai mais pas si vite... Comment puis-je me protéger ?
Dois-je Bannir l'adresse IP ?
Y'a t'il des scripts qui empechent les crawls trop nombreux et trop souvent d'une page par la meme ip ?
Merci
Depuis quelques jours une page particuliere de mon site est crawlé toute les 6 secondes par un energumene sans gene !!!!
Je me doutais que cela arriverai mais pas si vite... Comment puis-je me protéger ?
Dois-je Bannir l'adresse IP ?
Y'a t'il des scripts qui empechent les crawls trop nombreux et trop souvent d'une page par la meme ip ?
Merci
Cette page offre des code allopass...
Tous a l'heure je demandé si je devais bannir l'ip..
Mais je ne sais pas comment on fait.
Comment puis-je m'y prendre ?
Tous a l'heure je demandé si je devais bannir l'ip..
Mais je ne sais pas comment on fait.
Comment puis-je m'y prendre ?
Dernière édition par Nivek le Sam Juil 23, 2005 4:12, édité 1 fois.
- jensaisrien
- WRInaute passionné

- Messages: 753
- Inscription: Dim Mai 23, 2004 2:49
Comme je disais dans un autre topic, j'ai des grosses lacunes sur certains points. En voici un autre!
Comment as-tu fait pour voir que quelqu'un crawlé ta page toutes les 6 secondes?
JEnsaisrien
Comment as-tu fait pour voir que quelqu'un crawlé ta page toutes les 6 secondes?
JEnsaisrien
Bonjour
Le module IPban de php-nuke le fait!
Le risque c'est de bloquer un pan entier de l'internet...
Mais si c'est une ip fixe,il faut chercher a qui elle correspond
a quel robot!Ensuite dans le robot.txt de ton site il faut l'interdire!
#robot.txt
User-agent: Mediapartners-Google,[liste des robots autorisés]
Disallow: nom_du_robot qui saoule (je suis pas sur pour ca) ou ta page qui est trop crawlé
dans les meta robots de la page au niveau de la fréquence de crawl aussi
<META NAME="ROBOTS" CONTENT="ALL">
<META NAME="REVISIT-AFTER" CONTENT="1 DAYS">
<META NAME="RATING" CONTENT="GENERAL">
voilà un début
Le module IPban de php-nuke le fait!
Le risque c'est de bloquer un pan entier de l'internet...
Mais si c'est une ip fixe,il faut chercher a qui elle correspond
a quel robot!Ensuite dans le robot.txt de ton site il faut l'interdire!
#robot.txt
User-agent: Mediapartners-Google,[liste des robots autorisés]
Disallow: nom_du_robot qui saoule (je suis pas sur pour ca) ou ta page qui est trop crawlé
dans les meta robots de la page au niveau de la fréquence de crawl aussi
<META NAME="ROBOTS" CONTENT="ALL">
<META NAME="REVISIT-AFTER" CONTENT="1 DAYS">
<META NAME="RATING" CONTENT="GENERAL">
voilà un début
jensaisrien a écrit:Comment as-tu fait pour voir que quelqu'un crawlé ta page toutes les 6 secondes?
Avec les logs...
TOMHTML a écrit:si c'est une IP fixe t'as du bol, tu peux bloquer la page en question pour cette IP ou bloquer tout le site, c'est pas grave (via htaccess)
par contre si c'est pas fixe... je vois pas là
Oui c'est une IP fixe... J'y connais pas grand chose en Htaccess.
Quelqu'un peut me donner un exemple ?
Tu peux essayer ca dans ton .htaccess
coller dans le bloc note enregistrer sous htaccess.txt puis renommer sur le ftp en .htaccess
coller dans le bloc note enregistrer sous htaccess.txt puis renommer sur le ftp en .htaccess
- Code: Tout sélectionner
#remplacer les zeros par l'ip à bannir
RewriteEngine On
RewriteCond %{REMOTE_ADDR} 000\.000\.000\.000
RewriteRule .* - [F]
9 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Ouverture d'un forum consacré à DeepIndex sur WebRankInfo
- Conclusion sur l'analyse du PageRank de Google
- Séminaire référencement avec la CCIP Délégation de Paris le 12/12/2005
- Quelques nouveautés dans le forum
- Votre site est mal référencé ? Voilà les remèdes !
- Linkbait et linkbaiting : explications en français
- Outil de recherche des sous-domaines d'un site
- L'algorithme de Google en résumé (mars 2003)
- L'effet sandbox sur Google
- Mots clés PAP et de particulier à particulier
- fréquence des crawls
- Quels crawls pour google ?
- Fraicheur des crawls images de exalead ?
- 2 questions : Msn Bot et Crawls non souhaités...
- Full crawls et nombre de pages réellement indéxées
- A quoi servent des crawls de Google aussi fréquents ?
- Nombreux crawls sur tous mes sites venant d'une même IP
- Bannir
- TwengaBot/1.1 à bannir?
- Bannir via htaccess
- Bannir un membre
- bannir une ip ?
- Bien bannir qqun ?
- bannir par cookie
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités





le forum