Comptabiliser les visites des bots
Règles du forum
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !
Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).
Attention ce forum est destiné avant tout à ceux qui découvrent le référencement. Les membres qui auront l'amabilité de répondre à leurs questions sont priés de rester courtois, polis, indulgents, patients et pédagogues... Merci d'avance !
Par ailleurs, inutile d'utiliser ce forum uniquement pour obtenir des liens vers vos sites, les liens sont désactivés pour le référencement (nofollow).
16 messages
• Page 1 sur 2 • 1, 2
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

rudddy - WRInaute accro

- Messages: 2570
- Inscription: 1 Aoû 2007
Comptabiliser les visites des bots
Bonjour,
j'aimerais me faire un script qui comptabilise les visites des bots sur ma page, si possible en différenciant :
- le GGBot
- le BingBot
- le YahooBot
- le bot GG News
- le bot GG Blog
- le bot GG image
- le bot GG Adsense
...
Vaut-il mieux travailler par User Agent ou par IP ?
Est ce compliquer à maintenir ? si changement d'user agent ou d'ip ...
Merci de vos retours
j'aimerais me faire un script qui comptabilise les visites des bots sur ma page, si possible en différenciant :
- le GGBot
- le BingBot
- le YahooBot
- le bot GG News
- le bot GG Blog
- le bot GG image
- le bot GG Adsense
...
Vaut-il mieux travailler par User Agent ou par IP ?
Est ce compliquer à maintenir ? si changement d'user agent ou d'ip ...
Merci de vos retours
-

UsagiYojimbo - WRInaute accro

- Messages: 8575
- Inscription: 23 Nov 2005
Re: Comptabiliser les visites des bots
A une epoque il y avait http://www.crawltrack.net/fr/ qui répondait très bien à ce genre de problématique. Mais je ne sais pas si le script est toujours maintenu.
-

Zecat - WRInaute accro

- Messages: 11992
- Inscription: 1 Mar 2005
Re: Comptabiliser les visites des bots
rudddy a écrit:Vaut-il mieux travailler par User Agent ou par IP ?
Est ce compliquer à maintenir ? si changement d'user agent ou d'ip ...
Merci de vos retours
A mon avis faut coupler les deux (j'ai pas mal bossé la dessus) :
1 - premiere lame du rasoir : la plage d'ip
2 - deuxieme lame du rasoir : le user agent pour faire le tri
puisque avec une meme IP ca peut aussi bien etre du googlebot que du mediaprtner ...
Si tu veux maintenir ton truc a peu près up todate, il faut a mon avis etendre ton tracking a toutes les visites ... les point 1 et 2 ci dessus te permettant de sortir avec $isbot (true/false). Si false c'est a priori du visiteur non bot jusqu'à ce que tu vois passer un visiteur trop recurent (et la tu regardes si agent mérite que tu l'integre dans le cas isbot ... Bon viennent se greffer la dessus les aspi (plus ou moins barbares) ... perso j'ai pas fait dans la dentelle : plus de nn pages visitées dans une minute et boum ip bannie d'office de façon automatique (je recois juste un mail d'avis) ... le nn se reglant selon la nature des pages.
- Rod la Kox
- WRInaute accro

- Messages: 3253
- Inscription: 24 Juin 2008
Re: Comptabiliser les visites des bots
rudddy a écrit:Vaut-il mieux travailler par User Agent ou par IP ?
Les deux mon général...
rudddy a écrit:Est ce compliquer à maintenir ? si changement d'user agent ou d'ip ...
Non, car très peu de changement...
Par contre, en fonction du site analysé, prévoit un petite ou une gigantesque bdd.
-

Zecat - WRInaute accro

- Messages: 11992
- Inscription: 1 Mar 2005
Re: Comptabiliser les visites des bots
Pour eviter d'encombrer la bdd, un petit stockage bien structuré dan sdes documents .txt sur le serveur ... ca le fait aussi très bien ... d'autant plus que la c'est juste un stockage sans update ni accès concurrents en modif ...
- Rod la Kox
- WRInaute accro

- Messages: 3253
- Inscription: 24 Juin 2008
Re: Comptabiliser les visites des bots
+1
Les log en txt, c'est l'idéal pour les gros sites.
Les log en txt, c'est l'idéal pour les gros sites.
-

rudddy - WRInaute accro

- Messages: 2570
- Inscription: 1 Aoû 2007
Re: Comptabiliser les visites des bots
en fait je sais pas si c'est vraiment très gros, car je voudrais pas avoir la liste détaillé de chaque passage, mais par exemple des stats sur les 7 derniers jours, les 30 derniers jours et les 365 derniers jours, cad le nb de passage de chaque bot sans forcément avoir le détail par jour et par heure
-

Zecat - WRInaute accro

- Messages: 11992
- Inscription: 1 Mar 2005
Re: Comptabiliser les visites des bots
rudddy a écrit:en fait je sais pas si c'est vraiment très gros, car je voudrais pas avoir la liste détaillé de chaque passage, mais par exemple des stats sur les 7 derniers jours, les 30 derniers jours et les 365 derniers jours, cad le nb de passage de chaque bot sans forcément avoir le détail par jour et par heure
365 jours x 1000 visiteurs par jour = 365.000 mouvement. et si c'est 10.000 vu j ca passe a 3 millions de mouvements et des poussières ... (et encore la je suis gentil, je raisonne en visiteurs alors que ce que tu dois traquer ce sont le spages visitées - notamment pour les bots ... et donc tu peux tout multiplier par 3600 si tu poses comme postulat que sur un site bien frequenté par les bot, tu vois passer minimum 1 yahoo, 1 google, 5 yandex (quel goinfre celui la, etc etc ... par minute ...). Et je mets de coté les mediaprtners dont on se fout un peu en fait ... mais qu'il faut quand même traquer pour pouvoir les mettre de coté ...
- Casse bonbons dans une base de données quelle qu'elle soit (en plus juste pour du tracking !) ...
- Une formalité en document .txt (un dossier par an, un sous dossier par mois, un document par jour, une ligne par mouvement et a chaque visite le put qui va bien avec les 4 ou 4 info utiule (date-heure/IP/page/ etc ..). Et si tu veux des stats sans avoir a consolider tous ces doc a chaque fois, un petit txt de plus avec 365 données que tu mets ea jour en temps reel et un separateur entre chaque données pour imploder ca pepere). Tu peux aussi eclater ca par bot dans des doc specifique des l'arrivée, ... toujours ca de fait ...
Donc de toute façon, que tu le veuilles ou non, prepares toi a gérer du volume ...
-

UsagiYojimbo - WRInaute accro

- Messages: 8575
- Inscription: 23 Nov 2005
Re: Comptabiliser les visites des bots
Tu as un analyseur de logs genre Awstats ou Webtrends d'installé ? Parce que c'est typiquement le genre d'infos que tu peux y retrouver.
-

anemone-clown - WRInaute passionné

- Messages: 1276
- Inscription: 11 Nov 2007
Re: Comptabiliser les visites des bots
Pas la peine de se casser la tête; vive Browse Cap : http://alexandre.alapetite.fr/doc-alex/php-local-browscap/
C'est juste quand http://php.net/manual/fr/function.get-browser.php n'est pas implanté sur le serveur apache.
Il n'est, ensuite, pas compliqué de stocker les résultats dans un fichier temporaire et de faire un flush de temps en temps pour alimenter une bdd. Ainsi, il n'y a qu'une seule écriture (même pas de lecture) à chaque passage de bot en allant chercher le champ "crawler".
C'est juste quand http://php.net/manual/fr/function.get-browser.php n'est pas implanté sur le serveur apache.
Il n'est, ensuite, pas compliqué de stocker les résultats dans un fichier temporaire et de faire un flush de temps en temps pour alimenter une bdd. Ainsi, il n'y a qu'une seule écriture (même pas de lecture) à chaque passage de bot en allant chercher le champ "crawler".
-

anemone-clown - WRInaute passionné

- Messages: 1276
- Inscription: 11 Nov 2007
Re: Comptabiliser les visites des bots
Zecat a écrit:Une verrue de plus dépendant d'une tierce partie.
Apache et PHP sont des tierces parties et sources d'emmerdement??? On est mal barré là...
Bon, on n'a plus qu'à passer tous sous Windows et ASP.
-

Zecat - WRInaute accro

- Messages: 11992
- Inscription: 1 Mar 2005
Re: Comptabiliser les visites des bots
alors c'ets moi qui ai mal pigé ou se trouvait cette base de données ? 
Pour Geoip c'ets différent, une fois que tu as chargé le fichier binaire, tu ne fais plus appel a un tiers ... sauf pour les miases a jour mensuelles je te l'accorde ...
qui permet d’utiliser cette base de données browscap.ini. Comme l’utilisation de cette fonction nécessite de maintenir à jour la base de données, qui est fournie par des tiers et pas directement par PHP, nombre d’hébergeurs n’activent pas cette fonction.
Pour Geoip c'ets différent, une fois que tu as chargé le fichier binaire, tu ne fais plus appel a un tiers ... sauf pour les miases a jour mensuelles je te l'accorde ...
16 messages
• Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Ne pas comptabiliser mes visites dans Analytics
- stats : ne pas comptabiliser ses propres visites
- Comptabiliser les visites pour toute une rubrique
- Comptabiliser les visites sur les 7 derniers jours ?
- [réglé] Trop de visites (bots, referers)?
- comptabiliser des images hotlinkées
- comptabiliser les clicks sur envoi de formulaire
- Comment comptabiliser les clics sur un mail ?
- Comment comptabiliser proprement des rentrées PayPal ?
- solution pour comptabiliser des saisies de formulaire
- GoogleStats : analyse temps réel des visites de Google sur votre site - 02-10-2002
- Aux USA, Gmail dépasse YouTube en nombre de visiteurs - 13-03-2009
- Statistiques des requêtes sur les moteurs en 2006 - 07-07-2006
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot) - 05-09-2008
- Comment faire des liens en dur dans son annuaire - 08-11-2004
- Google au 4eme rang mondial en nb de visites - 08-07-2003
- Liens sponsorisés : XiTi mesure Google Content - 05-10-2006
- Comment analyser les visites provenant de Google SearchWiki - 09-12-2008
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
