Boulette : AOL publie des données privées (Oops trop tard)
50 messages
• Page 1 sur 4 • 1, 2, 3, 4
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

Monty973 - WRInaute passionné

- Messages: 1636
- Inscription: 21 Mar 2006
Boulette : AOL publie des données privées (Oops trop tard)
AOL a mis à disposition les données de plus de 20 millions de requêtes. de plus de 650.000 utilisateurs.
Elles comprennent les requêtes, les résultats cliqués, en quelle position...
Un zip de plus de 400Mb.
Mais il contient également beaucoup de données privées, on peut suivre toute les recherches d'un utilisateurs, et parmis elles, il y a des noms (ego search), des numéros de sécu ou des "comment assassiner votre femme", "acheter de l'ecstasy"... bref, embarassant.
Sans parler des experts du marketing qui vont décortiquer les requêtes pour voir étudier comportement des utilisateurs...
AOL a du se rendre compte de sa boulette, et a retiré le fichier, mais trop tard, des mirroirs ont été mis en place.
Après les débat autour de la diffusion des données qui ont eu lieu récemment, une telle erreure est incompréhensible.
Source Techcrunch.
http://www.techcrunch.com/2006/08/06/aol-proudly-releases-massive-amounts-of-user-search-data/
Elles comprennent les requêtes, les résultats cliqués, en quelle position...
Un zip de plus de 400Mb.
Mais il contient également beaucoup de données privées, on peut suivre toute les recherches d'un utilisateurs, et parmis elles, il y a des noms (ego search), des numéros de sécu ou des "comment assassiner votre femme", "acheter de l'ecstasy"... bref, embarassant.
Sans parler des experts du marketing qui vont décortiquer les requêtes pour voir étudier comportement des utilisateurs...
AOL a du se rendre compte de sa boulette, et a retiré le fichier, mais trop tard, des mirroirs ont été mis en place.
Après les débat autour de la diffusion des données qui ont eu lieu récemment, une telle erreure est incompréhensible.
Source Techcrunch.
http://www.techcrunch.com/2006/08/06/aol-proudly-releases-massive-amounts-of-user-search-data/
-

TOMHTML - WRInaute accro

- Messages: 3250
- Inscription: 25 Aoû 2004
j'ai le fichier >> 2.2 GO de données !
bon, tous les utilisateurs d'AOL sont remplacés par des "anonymous ID" mais bon
je peux savoir qu'une même personne a tapé "pregnancy test" avant de rechercher "card I'm pregnant !"...
ps : c'est bien y'a les sites qui ont été visités suite aux clics, j'apparais plein de fois
Zorgloob aussi
bon par contre j'arrive pas à mettre ça dans une base mysql...
bon, tous les utilisateurs d'AOL sont remplacés par des "anonymous ID" mais bon
je peux savoir qu'une même personne a tapé "pregnancy test" avant de rechercher "card I'm pregnant !"...
ps : c'est bien y'a les sites qui ont été visités suite aux clics, j'apparais plein de fois
bon par contre j'arrive pas à mettre ça dans une base mysql...
Dernière édition par TOMHTML le Lun Aoû 07, 2006 15:09, édité 1 fois.
- Albert1
- WRInaute impliqué

- Messages: 935
- Inscription: 23 Aoû 2005
TOMHTML a écrit:j'ai le fichier >> 2.2 GO octets !
bon, tous les utilisateurs d'AOL sont remplacés par des "anonymous ID" mais bon
je peux savoir qu'une même personne a tapé "pregnancy test" avant de rechercher "card I'm pregnant !"...
Je vais essayer de le choper ça ...
ça va bien me faire marrer je crois
- Albert1
- WRInaute impliqué

- Messages: 935
- Inscription: 23 Aoû 2005
TOMHTML a écrit:attention : ne pas l'ouvrir avec le bloc note de windows > ça l'explose....
m'étonne même pas
<anecdote>
j'ai souvenir d'une fois où j'avais essayé d'ouvrir une BDD d'un forum de taille moyenne avec cette daube ...
sinon, j'ai remplacé mon notepad Win par notepad2, même la calculatrice n'est plus celle d'origine ...
</anecdote>
Par contre, les débits, c'est pas trop çà , je suis rarement au maximum de ma connexion, donc soit le serveur que j'ai choisi est pourrave, soit y a du succès et ça limite la Bande Passante ; mais ça reste "correct", faut juste pas être trop pressé.
Je le mettrai peut être en download sur le réseau Gnutella après l'avoir reçu.
-

TOMHTML - WRInaute accro

- Messages: 3250
- Inscription: 25 Aoû 2004
vous pouvez ouvrir les fichiers avec WordPad, ça passe
par contre la base de données...
MySql > passe pas (même en virant la limite de tailles des fichiers à importer, c'est encore trop grand)
Excel > une feuille ne peut contenir que 65536 lignes... beaucoup beaucoup moins que le nombre de données dans les fichiers texte...
edit : sous linux ouvrez avec Vi
par contre la base de données...
MySql > passe pas (même en virant la limite de tailles des fichiers à importer, c'est encore trop grand)
Excel > une feuille ne peut contenir que 65536 lignes... beaucoup beaucoup moins que le nombre de données dans les fichiers texte...
edit : sous linux ouvrez avec Vi
50 messages
• Page 1 sur 4 • 1, 2, 3, 4
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Données privées et WHOIS
- Pour Google, les données privées sont sous contrôle
- Données privées : Facebook ouvre le dialogue avec ses utilis
- Oops, j’ai planté le forum :D
- question <h> et <p> (html basique) :oops:
- Les messages privées
- Vidéos publiques ou privées ?
- oops ... revenus du jour qui vont en marche arrièer !
- Partenariat e-commerce et Ventes Privées
- Boulette
Consultez la description détaillée des produits ou services de Google suivants : Google Base, Google AdWords API
- Test de positionnement sur data centers
Cet outil vous permet d'afficher sur une seule page les résultats Google effectués sur de nombreux data centers (centres de données).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités


