Boulette : AOL publie des données privées (Oops trop tard)
50 messages • Page 1 sur 4 • 1, 2, 3, 4
Boulette : AOL publie des données privées (Oops trop tard)
AOL a mis à disposition les données de plus de 20 millions de requêtes. de plus de 650.000 utilisateurs.
Elles comprennent les requêtes, les résultats cliqués, en quelle position...
Un zip de plus de 400Mb.
Mais il contient également beaucoup de données privées, on peut suivre toute les recherches d'un utilisateurs, et parmis elles, il y a des noms (ego search), des numéros de sécu ou des "comment assassiner votre femme", "acheter de l'ecstasy"... bref, embarassant.
Sans parler des experts du marketing qui vont décortiquer les requêtes pour voir étudier comportement des utilisateurs...
AOL a du se rendre compte de sa boulette, et a retiré le fichier, mais trop tard, des mirroirs ont été mis en place.
Après les débat autour de la diffusion des données qui ont eu lieu récemment, une telle erreure est incompréhensible.
Source Techcrunch.
http://www.techcrunch.com/2006/08/06/aol-proudly-releases-massive-amounts-of-user-search-data/
Elles comprennent les requêtes, les résultats cliqués, en quelle position...
Un zip de plus de 400Mb.
Mais il contient également beaucoup de données privées, on peut suivre toute les recherches d'un utilisateurs, et parmis elles, il y a des noms (ego search), des numéros de sécu ou des "comment assassiner votre femme", "acheter de l'ecstasy"... bref, embarassant.
Sans parler des experts du marketing qui vont décortiquer les requêtes pour voir étudier comportement des utilisateurs...
AOL a du se rendre compte de sa boulette, et a retiré le fichier, mais trop tard, des mirroirs ont été mis en place.
Après les débat autour de la diffusion des données qui ont eu lieu récemment, une telle erreure est incompréhensible.
Source Techcrunch.
http://www.techcrunch.com/2006/08/06/aol-proudly-releases-massive-amounts-of-user-search-data/
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
j'ai le fichier >> 2.2 GO de données !
bon, tous les utilisateurs d'AOL sont remplacés par des "anonymous ID" mais bon
je peux savoir qu'une même personne a tapé "pregnancy test" avant de rechercher "card I'm pregnant !"...
ps : c'est bien y'a les sites qui ont été visités suite aux clics, j'apparais plein de fois
Zorgloob aussi
bon par contre j'arrive pas à mettre ça dans une base mysql...
bon, tous les utilisateurs d'AOL sont remplacés par des "anonymous ID" mais bon
je peux savoir qu'une même personne a tapé "pregnancy test" avant de rechercher "card I'm pregnant !"...
ps : c'est bien y'a les sites qui ont été visités suite aux clics, j'apparais plein de fois
bon par contre j'arrive pas à mettre ça dans une base mysql...
Dernière édition par TOMHTML le Lun Aoû 07, 2006 16:09, édité 1 fois.
TOMHTML a écrit:j'ai le fichier >> 2.2 GO octets !
bon, tous les utilisateurs d'AOL sont remplacés par des "anonymous ID" mais bon
je peux savoir qu'une même personne a tapé "pregnancy test" avant de rechercher "card I'm pregnant !"...
Je vais essayer de le choper ça ...
ça va bien me faire marrer je crois
TOMHTML a écrit:attention : ne pas l'ouvrir avec le bloc note de windows > ça l'explose....
m'étonne même pas
<anecdote>
j'ai souvenir d'une fois où j'avais essayé d'ouvrir une BDD d'un forum de taille moyenne avec cette daube ...
sinon, j'ai remplacé mon notepad Win par notepad2, même la calculatrice n'est plus celle d'origine ...
</anecdote>
Par contre, les débits, c'est pas trop çà, je suis rarement au maximum de ma connexion, donc soit le serveur que j'ai choisi est pourrave, soit y a du succès et ça limite la Bande Passante ; mais ça reste "correct", faut juste pas être trop pressé.
Je le mettrai peut être en download sur le réseau Gnutella après l'avoir reçu.
vous pouvez ouvrir les fichiers avec WordPad, ça passe
par contre la base de données...
MySql > passe pas (même en virant la limite de tailles des fichiers à importer, c'est encore trop grand)
Excel > une feuille ne peut contenir que 65536 lignes... beaucoup beaucoup moins que le nombre de données dans les fichiers texte...
edit : sous linux ouvrez avec Vi
par contre la base de données...
MySql > passe pas (même en virant la limite de tailles des fichiers à importer, c'est encore trop grand)
Excel > une feuille ne peut contenir que 65536 lignes... beaucoup beaucoup moins que le nombre de données dans les fichiers texte...
edit : sous linux ouvrez avec Vi
Modérateur: WebRankInfo
50 messages • Page 1 sur 4 • 1, 2, 3, 4
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Accord entre AOL et Google
- Google pourrait prendre 5% de participation dans AOL
- Moteurs de recherche : la bataille des alliances fait rage
- AOL pourrait remplacer son partenaire Google par MSN
- Nombre moyen de mots par requête : statistiques AOL Août 2006
- Tête à tête avec Franck Poisson
- Répartition des clics sur les 10 premiers résultats Google
- Nombre de clics dans les pages de résultats : statistiques AOL Août 2006
- Parts de marché des moteurs en France (Avril 2008)
- Parts de marché des moteurs en France (Juillet 2008)
- Vidéos publiques ou privées ?
- question <h> et <p> (html basique) :oops:
- Sites ventes privées, l'identification comment ça marche ?
- "publié il y a ...'
- CMS pour gestion d'une association (cotisations, pages privées, ...) ?
- .NET framework 2 publié !!
- oops ... revenus du jour qui vont en marche arrièer !
- Boulette
- Dmoz - La Boulette !
- La boulette de la caisse d'épargne
- recupérer d'une boulette...
- L'AFNIC publie un dossier entre les NDD et le référencement
- Google publie des stats sur 1 milliards de pages
- J'ai fait une boulette...
- une boulette dans mysql ?
Consultez la description détaillée des produits ou services de Google suivants : Google Base
- Analyse de positionnement sur les data centers de Google
Cet outil vous permet d'afficher sur une seule page les résultats Google effectués sur de nombreux data centers (centres de données).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités







le forum