Hace unos días se hicieron públicos datos de las búsquedas de algunos usuarios de AOL, en realidad un “set” de las búsquedas que 658.000 usuarios hicieron durante 3 meses y que eran parte de los datos disponibles para la comunidad académica… salieron a la luz y empezaron a aparecer mirrors por todos lados.
Personalmente creo que AOL respondió rápido y bien, porque en cuanto se dieron cuenta dieron de baja el site de AOL Research con los datos, reconocieron públicamente su error, pidieron todas las disculpas del caso y fueron realistas al decir “la cagamos y pedimos disculpas, pero no hay mucho más que podamos hacer”.
El problema es que por primera vez se tiene un ejemplo de una persona identificada por estos “datos no personales” que uno deja al hacer búsquedas en Internet. Siempre se dice “los datos no son personales” o “los datos recolectados no permiten identificar a personas” pero en este caso el New York Times logró ubicar, y hacerle una nota, a una jubilada de 61 años que fue identificada sólo con los strings.
Ahora, lo interesante es que en la entrevista la persona dice “I had no idea somebody was looking over my shoulder.” y, pese a que es una jubilada y etc, la realidad es que la gente sigue pensando que hay privacidad en Internet cuando la que hay es poca, si es que queda algo.
Y esto no es un problema de AOL únicamente, porque todos, absolutamente todos, desde google hasta MSN recolectan datos y las herramientas de datamining de hoy en día tienen el poder suficiente para entender los megas y megas de datos que hay en esas bases. Pero, si esos datos se recolectan para “mejorar los motores de búsqueda” o “mejorar las herramientas de análisis de datos” y, por consiguiente, nos ayudan a tener una red más eficiente ¿habría que frenar esta práctica usual o no?
Es complicado pero, esperemos que, al menos comenzará un debate sobre como hacer los datos menos “personales” y mas generales para evitar estas cosas… en fin, una razon mas para decir que no hay privacidad en Internet.
8 respuestas en “Privacidad en las búsquedas en Internet”
Es la misma discusión de siempre no se trata de cuanto sacrificar en pros de mejorar, sino de la necesidad misma de hacer el sacrificio.
Increible nota, no creo que ya quede privasidad en internet, es algo privado pero totalmente publico.
Saludos
excelnete descubrimiento el del NYT y muy cierto que cada vez tendremos menos privacidad (alguna vez hubo?) en pro de mejorar la red
a partir de esto es que muchos se darán cuenta que conviene (y que no) poner en la casilla de busqueda de un sitio (incluyo a todos por igual)
[…] (vía denken über) […]
Somos lo que buscamos…
Al encarar este tema me acordé de un artículo que no hace mucho leí, ……
A site where you can search this data is here:
http://www.datablunder.com/logitems/query/
[…] Lo que me sorprende es que, pese a los últimos incidentes que hubo empiezan a aparecer críticas diciendo que: “esto es el cielo para los terroristas” y demás fauna ilegal. […]
[…] A los que nos gusta analizar datos, en estos días estamos de parabienes. Hace poco fueron los datos de search de AOL, que más allá de las discusiones por la privacidad, ofrecen un insight nunca antes conseguido sobre el comportamiento de los usuarios en los motores de búsqueda. Salvando las distancias con ese diamante en bruto de datos que nos entregó AOL, ahora Hitwise abrió una parte de su base de datos para que pueda ser consultada gratis (Gracias, Sergio!). […]