¿Big Data o Right Data?
Estadísticas.Mitos y verdades de la generación y el procesamiento de datos. Lo más obvio es creer que la revolución de big data tiene que ver con la masividad, tal vez el aspecto más saliente de la revolución de datos proveniente de la interacción don dispositivos interconectados como los celulares, las tarjetas de crédito o las redes sociales. Datos masivos que maridados con poderosos algoritmos parecen liberar a la ciencia y a la práctica cotidiana de las viejas lilmitaciones de la estadística tradicional. Una promesa de la estadística clásica es que más es mejor, es decir, que, si una estadística está correctamente diseñada, una muestra con más datos tiene que ser trivialmente mejor que una con menos. Desde esta perspectiva, big data debería ser la mejor de las noticias para los usuarios de datos. Pero la comparación de los datos de big data con los provenientes de fuentes tradicionales es de peras con manzanas. Big data es un océano de datos anárquicos no estructurados y espontáneos que en general no son generados por el mero propósito de obtenerlos sino como objetivos. En ciertos casos la información del big data genera datos más confiables que los de una encuesta tradicional. Muy posiblemente la revolución de big data no tenga tanto que ver con big -muchos- sino con right -correctos data. Es decir, con la promesa de que la proliferación de datos masivos contenga un subconjunto de datos correctos que correctamente estudiados y sistematizados permitan iluminar aspectos hasta ahora desconocidos de la ciencia, la política o la actividad empresarial.
Walter Sosa Escudero



