Script anti-aspirateur et Google (et les autres...)

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


malango
WRInaute discret
WRInaute discret
 
Messages: 89
Inscription: Mar Oct 14, 2003 7:51

Script anti-aspirateur et Google (et les autres...)

Message le Lun Avr 05, 2004 7:25

A la recherche d'un script qui m'aide à combattre le fléau des aspirateurs de sites, je suis tombé sur un script qui semble basé sur une bonne idée, astucieuse et tout et tout... mais qui me fait craindre qu'il ne banisse Google et les autres moteurs de recherche...
Les lignes qui dévoilent le principe :
//lien invisible pour la personne qui navigue sur le site
//mais pas pour l'aspirateur de site qui va se bannir en parcourant le lien
echo "<a href=ban.php></a>";
//parametre de connection a la base de données
$host = $SERVER_ADDR;
$uname = "root";
$pass = "";
$name = "Secure_IP";


Fûté, certes, mais est-que Google ne va pas suivre le lien? ou est-ce que, comme iles super-intelligent, il ne va pas réagir puisuqe la balise <a href> ne contient aucun texte?
:lol:

Grantome
WRInaute accro
WRInaute accro
 
Messages: 2899
Inscription: Ven Jan 16, 2004 19:47

...

Message le Lun Avr 05, 2004 8:22

Peut-être chaud pour le ggogle, mais.......

Si dans ta page ban, tu place en haut une balise meta "noindex".......

Je ne sais pas comment bosse google, mais s'il quitte dès qu'il voit la meta, il n'ira donc pas plus loin et tu pourra mettre se que tu veux par la suite.
Meta que l'aspi ne verra pas lui.


Par ontre les moteur qui ne comprennent pas la meta............ dommage.


macjee
WRInaute impliqué
WRInaute impliqué
 
Messages: 403
Inscription: Mar Avr 29, 2003 10:15

Message le Lun Avr 05, 2004 8:33

Je pense que ça ne sert pas à grand chose, de toute façon l'aspirateur va regarder toutes les urls de ta page. Il n'y a pas grand chose à faire sauf pour les gros sites le seul moyen me semble-t-il est de bloquer l'ip au delà d'un certain nombre de hits. Si ton site contient beaucoup de pages (plusieurs milliers)


malango
WRInaute discret
WRInaute discret
 
Messages: 89
Inscription: Mar Oct 14, 2003 7:51

Message le Lun Avr 05, 2004 9:03

Mmmmmmmouais......

Très chaud quand même!
J'aimerais pas trop disparaitre de Goggle, ne serait-ce qu'entre deux visites....

Bouhouhou! Je sais pas koi faire...
Il y a bien des scripts qui bloquent l'IP au delà d'un certain nombre de pages, mais ça fait appel à Mysql et j'ai déjà assez de pbl avec ça sans en rajouter!

Merci!
:wink:

fredsoft
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 242
Inscription: Dim Jan 26, 2003 22:39

Message le Lun Avr 05, 2004 9:37

malango a écrit:Mmmmmmmouais......

Très chaud quand même!
J'aimerais pas trop disparaitre de Goggle, ne serait-ce qu'entre deux visites....

Bouhouhou! Je sais pas koi faire...
Il y a bien des scripts qui bloquent l'IP au delà d'un certain nombre de pages, mais ça fait appel à Mysql et j'ai déjà assez de pbl avec ça sans en rajouter!

Merci!
:wink:


Il y a bien des scripts qui bloquent l'IP au delà d'un certain nombre de pages, mais ça fait appel à Mysql et j'ai déjà assez de pbl avec ça sans en rajouter!

-> tu oulbie ça...c'est antiflood qui va te sortir google aussi..pour virer les aspirateurs il faut un htaccess qui bloque en fonction du http agent, on trouve ça partout sur le net en cherchant un peu

Vampiloup
Nouveau WRInaute
 
Messages: 17
Inscription: Sam Fév 21, 2004 13:20

Message le Lun Avr 05, 2004 10:58

L' "HTTP agent", comme vous dites, ne sert strictement à rien (on sait combien les sites "d'ultra-pros" qui interdisent aux autres navigateurs qu'IE d'accéder à leur site sont en fait de gros nuls via ce système - si j'ose me permettre).
Les aspirateurs n'hésiteront pas un instant à truquer cette donnée pour se faire passer pour un navigateur ou un robot "correct".

Le seul moyen correct est effectivement un lien invisible bloqué par un fichier "robot.txt", et dont la page liée fait de "vilaines choses" (par exemple, inscrire l'IP appelante dans sa liste noire pour un certain temps et lui interdire désormais l'accès au site). Google ne sera absolument pas bloqué. Quant aux robots de moteurs qui refusent de respecter robot.txt, tu as vraiment l'impression qu'ils manqueraient ?


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités