Nouvelle "Encyclopédie des Robots" et UserAgents
8 messages • Page 1 sur 1
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
Nouvelle "Encyclopédie des Robots" et UserAgents
Bonjour,
Je voulais vous annoncer un heureux événement, la naissance de l'Encyclopédie des Robots. On n'est pas les premiers à publier une liste de robots, crawlers et autres spiders, mais, nous allons utiliser notre expérience de maintenance d'une liste de plus de 5000 annuaires pour faire grandir et tenir à jour cette nouvelle database des robots et UserAgents.
Le but est qu'en quelques secondes, vous puissiez décidez si les visites d'un robot sur votre site sont bénéfiques ou non. Vous pourrez alors l'exclure ou pas, en connaissance de cause.
Actuellement, pour chaque robot référencé, vous trouvez :
- le nom du propriétaire du robot ou de l'auteur du logiciel
- sa nationalité
- le type de robot (pour savoir si ce robot crawle le site ou s'il se contente de lire une page)
- une description du service concerné
- le UserAgent transmis aux serveurs web visités
- la plage d'adresses depuis laquelle le robot travaille
- une URL contenant des informations complémentaires
- les possibilités de restriction d'accès supportées par ce robot : robots.txt ou META ou autres
- le UserAgent à utiliser dans le robots.txt
- la date de mise à jour
Commentaires et critiques plus que bienvenus.
Jean-Luc
Je voulais vous annoncer un heureux événement, la naissance de l'Encyclopédie des Robots. On n'est pas les premiers à publier une liste de robots, crawlers et autres spiders, mais, nous allons utiliser notre expérience de maintenance d'une liste de plus de 5000 annuaires pour faire grandir et tenir à jour cette nouvelle database des robots et UserAgents.
Le but est qu'en quelques secondes, vous puissiez décidez si les visites d'un robot sur votre site sont bénéfiques ou non. Vous pourrez alors l'exclure ou pas, en connaissance de cause.
Actuellement, pour chaque robot référencé, vous trouvez :
- le nom du propriétaire du robot ou de l'auteur du logiciel
- sa nationalité
- le type de robot (pour savoir si ce robot crawle le site ou s'il se contente de lire une page)
- une description du service concerné
- le UserAgent transmis aux serveurs web visités
- la plage d'adresses depuis laquelle le robot travaille
- une URL contenant des informations complémentaires
- les possibilités de restriction d'accès supportées par ce robot : robots.txt ou META ou autres
- le UserAgent à utiliser dans le robots.txt
- la date de mise à jour
Commentaires et critiques plus que bienvenus.
Jean-Luc
Sympatoche !
Quid, par exemple, d'un classement thématique des robots, en plus du classement alphabétique actuel ?
Exemples :
-liste des robots extracteurs de mail
-liste des robots vérificateurs de liens
-liste des robots aspirateurs
-liste des robots tout gentils
...
Le genre de liste qui permet de refaire son fichier robots.txt rapidement, sans avoir à parcourir l'intégralité des fiches.
Non ?
Guillaume
Quid, par exemple, d'un classement thématique des robots, en plus du classement alphabétique actuel ?
Exemples :
-liste des robots extracteurs de mail
-liste des robots vérificateurs de liens
-liste des robots aspirateurs
-liste des robots tout gentils
...
Le genre de liste qui permet de refaire son fichier robots.txt rapidement, sans avoir à parcourir l'intégralité des fiches.
Non ?
Guillaume
Racine a écrit:Quid, par exemple, d'un classement thématique des r0b0ts, en plus du classement alphabétique actuel ?
Exemples :
-liste des r0b0ts extracteurs de mail
-liste des r0b0ts vérificateurs de liens
-liste des r0b0ts aspirateurs
-liste des r0b0ts tout gentils
...
les nationalités possibles (observées) de chaque bot seraient les bienvenues ...
par exemple : P0mp0s -> IP française
et en cas de classement, ce pourrait être un choix supplémentaire appréciable.
sinon, sympa comme idée ...
et assez original !
bonne continuation ...
-

Thierry Bugs - WRInaute accro

- Messages: 4369
- Inscription: Mer Juin 16, 2004 0:15
En effet très utile en surveillance des stats et pour mieux les comprendre, c'est bien d'avoir un outil qui donne des renseignements.
En fait on peut meme participer en te donnant des robots que l'on ne voit pas dans la liste
En fait on peut meme participer en te donnant des robots que l'on ne voit pas dans la liste
8 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par Julien Coquet, expert certifié officiellement par Google Analytics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Liste complète des produits et services de Google
- Lancement officiel de Knol, concurrent de Wikipedia ?
- Google : de la réussite sur Internet au phénomène de société
- Description des liens sponsorisés Google AdWords
- Sortie officielle de GoogleStats v2.0 !
- Google Health : votre dossier médical géré par Google...
- Sortie de GoogleStats v2.01
- La balise meta NOYDIR de Yahoo
- Les crawlers de Yahoo!
- Les robots MSNbot de Live Search
- <meta name="robots" content="noodp" /
- META NAME="ROBOTS" CONTENT="NOARCHIVE"
- Robots et la balise..."Robots"CONTENT="index,
- <meta name="robots" content="noindex, foll
- name="robots" content="noindex
- Avis sur agregateur de news "nouvelle generation"
- Question sur la balise meta "robots"
- wri 19eme sur "nouvelle vue du pont "
- Robots.txt : Exclure toute page sauf "telles pages"
- meta robots content="index follow"
Consultez la description détaillée des produits ou services de Google suivants : Google Health
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités





le forum