[Robots] Tests , detection , indexation.
1 message
• Page 1 sur 1
-

Ron56 - WRInaute impliqué

- Messages: 708
- Inscription: 20 Nov 2005
[Robots] Tests , detection , indexation.
Bonsoir a tous ,
Je post pour savoir si des Wrinautes sont intéréssé pour faire des tests sur les robots , test des séparateurs d'url , comment ameliorer la detection , et pourquoi pas a long terme fournir un systeme de stats le plus fiable possible pour les webmasters !
Si il y a des intéréssé , qui on des idées , vous n'avez qu'as poster ou m'ajouter sur MSN.
J'ai déja creer un petit site , qui n'est qu'une ebauche
-http://bot-farm.freezee.org/[/url]
Alors ce site detecte les robots qui viennent sur le site selon des ip partielles comme :
Car la plupart des ip on un début commun, ce qui permet de detecter un nombre important de robot, ce qui assure un bon rapport fiabilité/quantité .
Cette ébauche est d'ores et déja doté d'un backoffice qui permet :
-- d'ajouter des ip en masse, il suffit d'ajouter un liste d'ip , cela traite l'ip et dédoublonne la base, donc un minimun de travail :p :
Capture :
http://bot-farm.freezee.org/WRI/1.JPG
--Supprimer une ip de la base de données :
Capture :
http://bot-farm.freezee.org/WRI/2.JPG
--Supprimer un enregistrement de bot :
Capture :
http://bot-farm.freezee.org/WRI/2.JPG
Les futures ameliorations qui me viennent a l'idée :
- Vrai domaine , et hebergement pro ( je veux pas squatter trop freezee :p)
- Reduire le nombre de page, en utilisant des variables dans l'url
- Trouver un vrai nom ( google farm c'est en hommage au post pieger un ggbot ^^)
Je croit que j'ai fait le tour !
Ronan
Je n'est pas mis d'adsense car mon but n'est pas de généré des revenus , mais comme il a été prouvé que le bot adsense index aussi les pages , il sera eventuelement necessaire d'en mettre !
Je post pour savoir si des Wrinautes sont intéréssé pour faire des tests sur les robots , test des séparateurs d'url , comment ameliorer la detection , et pourquoi pas a long terme fournir un systeme de stats le plus fiable possible pour les webmasters !
Si il y a des intéréssé , qui on des idées , vous n'avez qu'as poster ou m'ajouter sur MSN.
J'ai déja creer un petit site , qui n'est qu'une ebauche
-http://bot-farm.freezee.org/[/url]
Alors ce site detecte les robots qui viennent sur le site selon des ip partielles comme :
- 66.249
64.233
64.68
63.83
216.239
216.33
210.131
Car la plupart des ip on un début commun, ce qui permet de detecter un nombre important de robot, ce qui assure un bon rapport fiabilité/quantité .
Cette ébauche est d'ores et déja doté d'un backoffice qui permet :
-- d'ajouter des ip en masse, il suffit d'ajouter un liste d'ip , cela traite l'ip et dédoublonne la base, donc un minimun de travail :p :
Capture :
http://bot-farm.freezee.org/WRI/1.JPG
--Supprimer une ip de la base de données :
Capture :
http://bot-farm.freezee.org/WRI/2.JPG
--Supprimer un enregistrement de bot :
Capture :
http://bot-farm.freezee.org/WRI/2.JPG
Les futures ameliorations qui me viennent a l'idée :
- Vrai domaine , et hebergement pro ( je veux pas squatter trop freezee :p)
- Reduire le nombre de page, en utilisant des variables dans l'url
- Trouver un vrai nom ( google farm c'est en hommage au post pieger un ggbot ^^)
Je croit que j'ai fait le tour !
Ronan
Je n'est pas mis d'adsense car mon but n'est pas de généré des revenus , mais comme il a été prouvé que le bot adsense index aussi les pages , il sera eventuelement necessaire d'en mettre !
1 message
• Page 1 sur 1
Lectures recommandées sur ce thème :
- Detection robots SPAM
- pas de détection des robots
- Detection des robots / htaccess
- améliorer la détection des robots
- Détection des robots Almaden et Pompos
- detection des robots sur pages htm?
- robots.txt et indexation
- Indexation robots.txt
- Indexation du fichier robots.txt
- Indexation d'images et robots.txt
Consultez la description détaillée des produits ou services de Google suivants : Google Website Optimizer
- Analyse de similarité textuelle
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués. - Déterminer l'âge d'un site
Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org). - Liste de sous-domaines
Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site. - Test de redirection
Cet outil vous permet de tester la validité d'un lien pour le référencement. Il vous indique la nature du lien (lien en dur, redirection bien gérée par les moteurs ou redirection mal gérée par les moteurs).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
