Como una garrapata, un tuit es capaz de contener muchas veces su propio
peso en metadatos que cuentan cosas sobre ti, sin que tu lo sepas.
Los datos son el contenido de una comunicación y los
metadatos son la información extra que se genera en el proceso. Lo hace
de manera automática y oculta, sin avisar. Cada foto que hacemos, cada
texto que cortipegamos, cada correo que enviamos está lleno de
información oculta. Esa información no solo es reveladora, también es
sustanciosa. En ningún otro contexto se manifiesta esta extraña realidad
inversa como en un tuit.
Aunque Twitter sólo permite
publicar 140 caracteres cada vez, cada actualización incluye un
contingente de datos que revelan aspectos de nuestra identidad,
localización, tecnología y contexto. Como muestra, este documento que se
le escapó a Raffi Krikorian, responsable de toda la infraestructura
interna de Twitter hasta Agosto de 2014.
Cada vez que publicamos un actualización sobre nuestra
serie favorita o nos alimentamos el odio ninguneando públicamente a un
político, estamos informando de quiénes somos, cuánta gente nos sigue,
con qué sistema operativo trabajamos o desde qué barrio. Y no sólo
informamos a Twitter.
Cualquier compañía haciendo análisis de datos del
tráfico de Twitter es capaz de aprovechar esa información de muchas
maneras distinta. Casi siempre con fines comerciales, pero no
necesariamente.
Como apuntaba la empresa de minería
de datos Elasticsearch -hoy Elastic.co- a Elizabeth Dwoskin en el Wall
Street Journal, podemos determinar a cuánta gente en una determinada
área le ha gustado un producto y cómo evoluciona en el tiempo, o qué
impacto ha tenido un tuit en un sector de la población. MapBox usa los
metadatos de millones de usuarios para, por ejemplo, identificar turistas, qué idioma hablan y qué teléfono usan.
Un mapa que no existe pero que es fácil de imaginar es el que se deriva
de la combinación de esas tres búsquedas: si no eres ciudadano, hablas
otro idioma y llevas un teléfono barato, no eres un turista, eres un
inmigrante.
Como siempre, lo más importante recordar que esta información es
acumulativa y que llega en peligrosa combinación con otros datos,
generados por nuestras tarjetas de crédito, nuestros dispositivos
móviles, nuestros logins para ver el correo o
comprar billetes de avión aquí o allí. Una compañía como Elastic.co
analiza muchas fuentes distintas de metadatos desde muchos ángulos
diferentes, dependiendo del cliente en cuestión. Twitter es sólo un
gramo más en la barra libre de datos que ofrecemos al mundo. Ni siquiera
la peor.
Fuente: ElDiario