Script anti-aspirateur et Google (et les autres...)
6 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Script anti-aspirateur et Google (et les autres...)
A la recherche d'un script qui m'aide à combattre le fléau des aspirateurs de sites, je suis tombé sur un script qui semble basé sur une bonne idée, astucieuse et tout et tout... mais qui me fait craindre qu'il ne banisse Google et les autres moteurs de recherche...
Les lignes qui dévoilent le principe :
Fûté, certes, mais est-que Google ne va pas suivre le lien? ou est-ce que, comme iles super-intelligent, il ne va pas réagir puisuqe la balise <a href> ne contient aucun texte?

Les lignes qui dévoilent le principe :
//lien invisible pour la personne qui navigue sur le site
//mais pas pour l'aspirateur de site qui va se bannir en parcourant le lien
echo "<a href=ban.php></a>";
//parametre de connection a la base de données
$host = $SERVER_ADDR;
$uname = "root";
$pass = "";
$name = "Secure_IP";
Fûté, certes, mais est-que Google ne va pas suivre le lien? ou est-ce que, comme iles super-intelligent, il ne va pas réagir puisuqe la balise <a href> ne contient aucun texte?
...
Peut-être chaud pour le ggogle, mais.......
Si dans ta page ban, tu place en haut une balise meta "noindex".......
Je ne sais pas comment bosse google, mais s'il quitte dès qu'il voit la meta, il n'ira donc pas plus loin et tu pourra mettre se que tu veux par la suite.
Meta que l'aspi ne verra pas lui.
Par ontre les moteur qui ne comprennent pas la meta............ dommage.
Si dans ta page ban, tu place en haut une balise meta "noindex".......
Je ne sais pas comment bosse google, mais s'il quitte dès qu'il voit la meta, il n'ira donc pas plus loin et tu pourra mettre se que tu veux par la suite.
Meta que l'aspi ne verra pas lui.
Par ontre les moteur qui ne comprennent pas la meta............ dommage.
Je pense que ça ne sert pas à grand chose, de toute façon l'aspirateur va regarder toutes les urls de ta page. Il n'y a pas grand chose à faire sauf pour les gros sites le seul moyen me semble-t-il est de bloquer l'ip au delà d'un certain nombre de hits. Si ton site contient beaucoup de pages (plusieurs milliers)
Mmmmmmmouais......
Très chaud quand même!
J'aimerais pas trop disparaitre de Goggle, ne serait-ce qu'entre deux visites....
Bouhouhou! Je sais pas koi faire...
Il y a bien des scripts qui bloquent l'IP au delà d'un certain nombre de pages, mais ça fait appel à Mysql et j'ai déjà assez de pbl avec ça sans en rajouter!
Merci!

Très chaud quand même!
J'aimerais pas trop disparaitre de Goggle, ne serait-ce qu'entre deux visites....
Bouhouhou! Je sais pas koi faire...
Il y a bien des scripts qui bloquent l'IP au delà d'un certain nombre de pages, mais ça fait appel à Mysql et j'ai déjà assez de pbl avec ça sans en rajouter!
Merci!
malango a écrit:Mmmmmmmouais......
Très chaud quand même!
J'aimerais pas trop disparaitre de Goggle, ne serait-ce qu'entre deux visites....
Bouhouhou! Je sais pas koi faire...
Il y a bien des scripts qui bloquent l'IP au delà d'un certain nombre de pages, mais ça fait appel à Mysql et j'ai déjà assez de pbl avec ça sans en rajouter!
Merci!
Il y a bien des scripts qui bloquent l'IP au delà d'un certain nombre de pages, mais ça fait appel à Mysql et j'ai déjà assez de pbl avec ça sans en rajouter!
-> tu oulbie ça...c'est antiflood qui va te sortir google aussi..pour virer les aspirateurs il faut un htaccess qui bloque en fonction du http agent, on trouve ça partout sur le net en cherchant un peu
L' "HTTP agent", comme vous dites, ne sert strictement à rien (on sait combien les sites "d'ultra-pros" qui interdisent aux autres navigateurs qu'IE d'accéder à leur site sont en fait de gros nuls via ce système - si j'ose me permettre).
Les aspirateurs n'hésiteront pas un instant à truquer cette donnée pour se faire passer pour un navigateur ou un robot "correct".
Le seul moyen correct est effectivement un lien invisible bloqué par un fichier "robot.txt", et dont la page liée fait de "vilaines choses" (par exemple, inscrire l'IP appelante dans sa liste noire pour un certain temps et lui interdire désormais l'accès au site). Google ne sera absolument pas bloqué. Quant aux robots de moteurs qui refusent de respecter robot.txt, tu as vraiment l'impression qu'ils manqueraient ?
Les aspirateurs n'hésiteront pas un instant à truquer cette donnée pour se faire passer pour un navigateur ou un robot "correct".
Le seul moyen correct est effectivement un lien invisible bloqué par un fichier "robot.txt", et dont la page liée fait de "vilaines choses" (par exemple, inscrire l'IP appelante dans sa liste noire pour un certain temps et lui interdire désormais l'accès au site). Google ne sera absolument pas bloqué. Quant aux robots de moteurs qui refusent de respecter robot.txt, tu as vraiment l'impression qu'ils manqueraient ?
6 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Google Pack s'enrichit de 2 nouveaux logiciels gratuits
- La valse des rachats de sociétés par Google en mai/juin 2007
- Les albums web Picasa passent à 1 Go de stockage
- Photos satellite des incendies en Grèce dans Google Earth
- Ajouter un Gadget Google sur son site
- Google Desktop pour Mac OS X
- Picasa Web Albums en français
- Résultats des élections présidentielles du 1er tour 2007
- AdSense Tracking : statistiques détaillées sur les clics AdSense
- Résultats des élections législatives du 1er tour 2007
- Script php Anti aspirateur.
- Mon script anti-aspirateur a blacklisté googlebot.
- Anti aspirateur: ne pas bloquer Google
- anti-aspirateur
- Anti aspirateur URGENT ?
- mod_rewrite et anti aspirateur
- /!\ aspirateur de site et anti référencement ...
- .htaccess anti-aspirateur de site
- Anti aspirateur de site : une idée
- script anti-spam robots et anti-pirates...
- Aspirateur de site web (.htaccess + script)
Qui est en ligne
Utilisateurs parcourant ce forum: touftouf et 0 invités





le forum