Logs serveurs web /dev/null ?

Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics


Julia41
WRInaute impliqué
WRInaute impliqué
 
Messages: 441
Inscription: Ven Aoû 31, 2007 21:17

Logs serveurs web /dev/null ?

Message le Lun Juin 16, 2008 16:57

J'ai désactivé les logs de mes serveurs web sous peu afin de diminuer la charge (2Go de logs/heure)... Mais je me posais la question s'il y avait des obligations légales de garder ces fichiers...

Sinon, mis à part les stats, et les possibles hacks/bugs qu'on ne pourrait pas retrouver, voyez-vous d'autres inconvénients ?


Bool
WRInaute accro
WRInaute accro
 
Messages: 1290
Inscription: Jeu Fév 26, 2004 15:59

Message le Lun Juin 16, 2008 17:14

Il me semble qu'avec la LCEN et les futures dispositions récemment évoquées il y a quelques 6 mois de conservation. En pratique je ne pense pas que grand monde le fasse.

Et comme tu le dis coté hacks/bugs ces logs sont quand même vachement pratiques.

Maintenant 2Go de logs par heure, ça m'étonne. J'héberge quelques sites avec un trafic quand même conséquent qui atteint plusieurs Giga par jour (réparti sur plusieurs machines) ; mais on reste bien loin des 2Go par heure...
A moins qu'il s'agisse d'erreurs PHP ? ou encore du log de rewriting :P


2dm
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 205
Inscription: Mar Sep 03, 2002 19:46

Message le Lun Juin 16, 2008 17:19

Tu pourrais essayer d'extraire les informations les plus importantes avant de les supprimer.

Je pense que garder les informations sur la (les tentatives de) connexion + l'ajout de contenu est nécessaire.

Si t'as 2Go de l'heure de log, tu devrais pouvoir arriver à une centaine de Mo. Si tu compresses ça, tu devrais pouvoir atteindre une petite cinquantaine de Mo. Soit 1Go/jour.

Après, tout dépend comment tu gères ta sécurité. Mais je ne crois pas que supprimer tous les logs directement soit recommandable.


Julia41
WRInaute impliqué
WRInaute impliqué
 
Messages: 441
Inscription: Ven Aoû 31, 2007 21:17

Message le Lun Juin 16, 2008 17:21

Ce sont des URLs très longues (si j'étais resté sur apache j'aurais des erreurs de type URL too long)...

La désactivation est aussi là pour préserver l'anonymat des utilisateurs (j'ai été très surpris de la réaction de ceux qui savaient ce qu'était les fichiers de logs (dans le bon sens du terme))

Edit pour 2dm qui a répondu avant moi...

Le problème est surtout les écritures niveaux disques qui font ramer énormément les accès...
Après ce n'est pas un problème d'espace disque...

Pour ce qui est de garder les uploads de fichiers ou autres choses, ceci est gardé sur un autre serveur qui ne sert qu'à ce genre de chose...


Bool
WRInaute accro
WRInaute accro
 
Messages: 1290
Inscription: Jeu Fév 26, 2004 15:59

Message le Lun Juin 16, 2008 17:31

Pour les URL, cela m'étonne quand même... tu y mets quoi dedans ? Il n'y aurait pas moyen de les réduire ? Voir de les compresser ?

Pour le problème des accès disques, Apache 2 permet de bufferiser les logs afin de limiter les écritures... ton serveur n'a t-il pas d'option de ce genre ?

Edit : en passant plutôt que d'envoyer les logs vers /dev/null autant les désactiver, ça évite quelques traitements inutiles.


Julia41
WRInaute impliqué
WRInaute impliqué
 
Messages: 441
Inscription: Ven Aoû 31, 2007 21:17

Message le Lun Juin 16, 2008 17:36

Avec apache peut-être, je suis sous Lighty depuis un certains temps, et non, les URLs ne peuvent pas être compressées car certains clients ne sont pas compatibles...

Je parlais principalement niveau légalité bien sûr et savoir si j'avais zappés quelques désavantages...


Ron56
WRInaute passionné
WRInaute passionné
 
Messages: 706
Inscription: Dim Nov 20, 2005 20:05

Message le Lun Juin 16, 2008 17:38

Bool a écrit:Pour les URL, cela m'étonne quand même... tu y mets quoi dedans ? Il n'y aurait pas moyen de les réduire ? Voir de les compresser ?

Pour le problème des accès disques, Apache 2 permet de bufferiser les logs afin de limiter les écritures... ton serveur n'a t-il pas d'option de ce genre ?

Edit : en passant plutôt que d'envoyer les logs vers /dev/null autant les désactiver, ça évite quelques traitements inutiles.


C'est lighttpd qui est utilisé ici ;)


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2653
Inscription: Lun Mai 03, 2004 14:48

Message le Lun Juin 16, 2008 17:48

Julia41 a écrit:La désactivation est aussi là pour préserver l'anonymat des utilisateurs
Je me demande bien quelle activité légale peut exiger une telle discrétion dans un pays comme la France ou la Belgique... :roll:

Jean-Luc


Bool
WRInaute accro
WRInaute accro
 
Messages: 1290
Inscription: Jeu Fév 26, 2004 15:59

Message le Lun Juin 16, 2008 17:50

Bah selon le contenu des URL en question, un coup de gzip + base64 pourrait convenir ; sans vraiment de problèmes de compatibilité. A moins qu'il s'agisse de données issus de formulaires GET.
Mais tu as raison, on s'éloigne complètement du sujet de départ. C'est juste que ça m'intrigue vraiment d'en arriver à des URL de ce genre ; j'ai tendance à penser trop rapidement à une vilaine erreur de conception.

Pour Lighty, il n'y a effectivement aucune option coté logs (du moins je n'en ai pas vu)... mis a part l'utilisation d'un pipe quoi, ce qui risque de pas mal compliquer les choses.


Edit : moi aussi Jean-Luc, surtout que s'il s'agit d'un "anonymiseur" c'est lui qui endosse la responsabilité... et sans les logs, il n'a à priori plus rien pour se défendre...


Julia41
WRInaute impliqué
WRInaute impliqué
 
Messages: 441
Inscription: Ven Aoû 31, 2007 21:17

Message le Lun Juin 16, 2008 17:58

Bah je ne veux pas les garder, les seuls réticences que j'avais été pour les hacks et trucs du genre...

Les URLs sont envoyés par le client... Et en ce qui concerne gzip + base64 bah cela ferait rammait un peu plus pour la compression, mais de toute façon cette compression devrait être fait côté client...

Enfin bon, je cherche simplement à les virer...

@jeanluc: Personnelement, moins mon IP est enregistré plus je suis content... Je n'ai pas dit que c'était en France, ni que c'était illégal (en France ou dans un autre pays)...


Bool
WRInaute accro
WRInaute accro
 
Messages: 1290
Inscription: Jeu Fév 26, 2004 15:59

Message le Lun Juin 16, 2008 18:38

Et en ce qui concerne gzip + base64 bah cela ferait rammait un peu plus pour la compression, mais de toute façon cette compression devrait être fait côté client...


C'était uniquement dans le cas où tu les conserverais pour les quelques raisons évoquées ci dessus.
Si ton serveur est ralenti à cause du volume d'écriture, il peut être intéressant de charger légèrement plus le CPU afin de réduire les écritures justement.

Voir de déporter les logs ailleurs...


Enfin, sans connaître ton activité si mystérieuse (anonymiseur ou regroupement d'URL de download de films ? :D) difficile d'être de bon conseil.


Julia41
WRInaute impliqué
WRInaute impliqué
 
Messages: 441
Inscription: Ven Aoû 31, 2007 21:17

Message le Lun Juin 16, 2008 19:09

Je demandais juste s'il y avait une obligation légale et d'autres choses que j'aurais oublié, je sais qu'un hébergeur faisant du mutu doit les garder pendant X années...
Après c'est un peu comme si on me demandait de garder une copie du CO2 rejetté par ma voiture :P (exemple bidon)

Enfin voilà...

jcaron
WRInaute accro
WRInaute accro
 
Messages: 1139
Inscription: Ven Fév 13, 2004 20:33

Re: Logs serveurs web /dev/null ?

Message le Lun Juin 16, 2008 22:01

Julia41 a écrit:J'ai désactivé les logs de mes serveurs web sous peu afin de diminuer la charge (2Go de logs/heure)... Mais je me posais la question s'il y avait des obligations légales de garder ces fichiers...

Sinon, mis à part les stats, et les possibles hacks/bugs qu'on ne pourrait pas retrouver, voyez-vous d'autres inconvénients ?


2 Go de logs par heure? Des logs d'accès genre http-access.log? J'y crois pas trop, non. Avec une longueur moyenne de ligne de logs de 500 octets (c'est déjà beaucoup), ça fait 4 millions d'accès par heure, plus de 1000 requêtes par seconde. Et ça fait surtout plusieurs Gbits/s de données échangées. Et je ne te parle pas des problématiques que tu aurais en termes de nombre de ports, sockets, processus simultanés et tout le tintouin. Mon petit doigt (qui se trompe rarement) me dit que tout ça ne tient pas sur une seule machine, et que son coût excéderait probablement assez nettement ton budget.

Donc soit:
- il s'agit d'autres logs (log d'erreurs et traces diverses et variées), auquel cas ben il faut nettoyer
- on est bien loin des 2 Go/h et l'intérêt de les désactiver reste bien modéré

Sinon, sur le fond, si comme je l'ai compris tu opères un proxy, je te conseille très vivement de garder des logs, et pour des mois plutôt que des jours. Tu vas un jour ou un autre recevoir une requête de nos amis des forces de l'ordre, et tu as bien intérêt à être en mesure de les fournir.

Pour référence, je te conseille la lecture de l'article L.34-1 du Code des Postes et Communications Electroniques (disponible du www.legifrance.gouv.fr comme d'habitude), ainsi que du L.32 qui contient les définitions associées, dont le 2° inclut bien (implicitement) les proxies. L'article R10-13 donne plus de détails, en particulier l'obligation de conservation des logs pendant un an.

Ceci dit, rien ne t'oblige à conserver les logs complets (tu peux te passer de beaucoup d'infos, ce qui compte le plus c'est l'IP, la date/heure, l'URL visitée, le reste tu peux probablement jeter), et tu peux évidemment les compresser et les stocker ailleurs.

Jacques.


Julia41
WRInaute impliqué
WRInaute impliqué
 
Messages: 441
Inscription: Ven Aoû 31, 2007 21:17

Message le Lun Juin 16, 2008 22:05

...me dit que tout ça ne tient pas sur une seule machine


Je n'ai pas dit une seule machine, bien au contraire... Je parle bien de l'infra, mais les 2Go se retrouvre très rapidement sur le serveur servant de LB... Entre les réponses, les down, les ups... etc...

Il ne s'agit pas d'un proxy, mais je vais tout de même aller fouiner sur legifrance...

Edit : Impossible de trouver quelque chose sur ce site gouvernemental :P


raljx
WRInaute accro
WRInaute accro
 
Messages: 2190
Inscription: Lun Juil 10, 2006 16:46

Message le Lun Juin 16, 2008 22:14

Julia41 a écrit:
...me dit que tout ça ne tient pas sur une seule machine


Je n'ai pas dit une seule machine, bien au contraire... Je parle bien de l'infra, mais les 2Go se retrouvre très rapidement sur le serveur servant de LB... Entre les réponses, les down, les ups... etc...

Il ne s'agit pas d'un proxy, mais je vais tout de même aller fouiner sur legifrance...

Edit : Impossible de trouver quelque chose sur ce site gouvernemental :P


Je suis dans le meme cas que toi. Je supprimais mes logs (j'essayez bien de les downloader mais tu imagines bien la cata en terme d'espace et de temps). J'ai donc opté pour une synchro via rsync sur un serveur externe pour tout ce qui est error-log / sys-log et pour une sauvegarde LTO 800Go pour les access-log en choisissant les infos a generer.

Logs serveurs web /dev/null ?

Formation recommandée sur ce thème :

Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par Julien Coquet, expert certifié officiellement par Google Analytics.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités