Messages: 89

Enregistré le: 14 Oct 2003

Message le Lun Avr 05, 2004 8:25

A la recherche d'un script qui m'aide à combattre le fléau des aspirateurs de sites, je suis tombé sur un script qui semble basé sur une bonne idée, astucieuse et tout et tout... mais qui me fait craindre qu'il ne banisse Google et les autres moteurs de recherche...
Les lignes qui dévoilent le principe :
//lien invisible pour la personne qui navigue sur le site
//mais pas pour l'aspirateur de site qui va se bannir en parcourant le lien
echo "<a href=ban.php></a>";
//parametre de connection a la base de données
$host = $SERVER_ADDR;
$uname = "root";
$pass = "";
$name = "Secure_IP";


Fûté, certes, mais est-que Google ne va pas suivre le lien? ou est-ce que, comme iles super-intelligent, il ne va pas réagir puisuqe la balise <a href> ne contient aucun texte?
:lol:
Haut
5 Réponses
Messages: 2899

Enregistré le: 16 Jan 2004

Message le Lun Avr 05, 2004 9:22

...

Peut-être chaud pour le ggogle, mais.......

Si dans ta page ban, tu place en haut une balise meta "noindex".......

Je ne sais pas comment bosse google, mais s'il quitte dès qu'il voit la meta, il n'ira donc pas plus loin et tu pourra mettre se que tu veux par la suite.
Meta que l'aspi ne verra pas lui.


Par ontre les moteur qui ne comprennent pas la meta............ dommage.
Haut
Messages: 411

Enregistré le: 29 Avr 2003

Message le Lun Avr 05, 2004 9:33

Je pense que ça ne sert pas à grand chose, de toute façon l'aspirateur va regarder toutes les urls de ta page. Il n'y a pas grand chose à faire sauf pour les gros sites le seul moyen me semble-t-il est de bloquer l'ip au delà d'un certain nombre de hits. Si ton site contient beaucoup de pages (plusieurs milliers)
Haut
Messages: 89

Enregistré le: 14 Oct 2003

Message le Lun Avr 05, 2004 10:03

Mmmmmmmouais......

Très chaud quand même!
J'aimerais pas trop disparaitre de Goggle, ne serait-ce qu'entre deux visites....

Bouhouhou! Je sais pas koi faire...
Il y a bien des scripts qui bloquent l'IP au delà d'un certain nombre de pages, mais ça fait appel à Mysql et j'ai déjà assez de pbl avec ça sans en rajouter!

Merci!
:wink:
Haut
Messages: 242

Enregistré le: 26 Jan 2003

Message le Lun Avr 05, 2004 10:37

malango a écrit:Mmmmmmmouais......

Très chaud quand même!
J'aimerais pas trop disparaitre de Goggle, ne serait-ce qu'entre deux visites....

Bouhouhou! Je sais pas koi faire...
Il y a bien des scripts qui bloquent l'IP au delà d'un certain nombre de pages, mais ça fait appel à Mysql et j'ai déjà assez de pbl avec ça sans en rajouter!

Merci!
:wink:


Il y a bien des scripts qui bloquent l'IP au delà d'un certain nombre de pages, mais ça fait appel à Mysql et j'ai déjà assez de pbl avec ça sans en rajouter!

-> tu oulbie ça...c'est antiflood qui va te sortir google aussi..pour virer les aspirateurs il faut un htaccess qui bloque en fonction du http agent, on trouve ça partout sur le net en cherchant un peu
Haut
Messages: 17

Enregistré le: 21 Fév 2004

Message le Lun Avr 05, 2004 11:58

L' "HTTP agent", comme vous dites, ne sert strictement à rien (on sait combien les sites "d'ultra-pros" qui interdisent aux autres navigateurs qu'IE d'accéder à leur site sont en fait de gros nuls via ce système - si j'ose me permettre).
Les aspirateurs n'hésiteront pas un instant à truquer cette donnée pour se faire passer pour un navigateur ou un robot "correct".

Le seul moyen correct est effectivement un lien invisible bloqué par un fichier "robot.txt", et dont la page liée fait de "vilaines choses" (par exemple, inscrire l'IP appelante dans sa liste noire pour un certain temps et lui interdire désormais l'accès au site). Google ne sera absolument pas bloqué. Quant aux robots de moteurs qui refusent de respecter robot.txt, tu as vraiment l'impression qu'ils manqueraient ?
Haut