jueves, 2 de febrero de 2017


"Bigdataismo"

Sobre la inteligencia de datos, sus limitaciones y la fe en el “big data”1
Autor: Gonzalo Casino Fuente: IntraMed / Fundación Esteve 
Damos por sentado un tanto a la ligera que la actual acumulación masiva de datos es una fuente valiosa de información, conocimiento, riqueza y poder. Ciertamente, las nuevas tecnologías son capaces de almacenar un volumen increíble de datos sobre las personas, las cosas y todo tipo de hechos. Los datos son la materia prima con la que operan las ciencias, y de ahí se deriva en parte su prestigio, pero ocupan un lugar cada vez más relevante en la política y las empresas. La metáfora que presenta los datos como el nuevo petróleo de la economía digital es doblemente atinada, pues permite entrever la existencia de “pozos” o bases de datos sin refinar y la consiguiente “fiebre” para procesar este inagotable combustible informativo. Tal y como ocurrió con la fiebre del oro y la del petróleo, en este nuevo El Dorado del big data no es oro todo lo que reluce.
Aunque el concepto de dato es impreciso y previo a los ordenadores, resulta indisociable de la existencia de bases de datos y su tratamiento informático. Estadísticamente, un dato es cualquier valor de una variable cuantitativa o cualitativa, ya sea la nacionalidad de una persona, el correo electrónico que escribe o la página que visita en internet. El registro de datos masivos no se limita a la investigación de asuntos complejos, como el clima, el genoma y las búsquedas por internet, sino que se extiende al comercio, la comunicación, la salud y otros ámbitos. Un teléfono, un reloj con funciones biométricas y tantos otros artilugios personales suministran una cantidad ingente de datos. La novedad reside tanto en la ampliación de los ámbitos registrados como en el volumen de datos, cuya escala descomunal y creciente obliga a ampliar cada poco de unidades de medida.
Los datos en bruto son códigos sin significado. Extraer información de ellos requiere conocimientos y capacidad de interpretación
La idea es que el análisis de estos macrodatos permitirá extraer información y realizar predicciones. Pensemos, por ejemplo, en lo que comprará una persona, el partido al que votará o sus riesgos de enfermar. Esta información es muy valiosa. De ahí que la gratuidad de muchos servicios no es tal: pagamos con los datos que suministramos. Y por eso las escuelas de negocios prestan una atención creciente al big data, hasta el punto de que los MSA (masters of science in analytics) podrían llegar a ser competencia de los clásicos MBA, como apuntaba recientemente The Economist. El valor de los datos reside en su promesa de predicción e influencia, pero esta posibilidad tiene sus dificultades y limitaciones (la economía es uno de sus santuarios, y ya conocemos su limitada capacidad predictiva).
De entrada, los datos en bruto son códigos sin significado. Extraer información de ellos requiere conocimientos y capacidad de interpretación. Las herramientas de análisis y visualización de macrodatos pueden facilitar el trabajo, pero necesitan una orientación experta. Porque ver y leer es siempre reconocer; de otro modo, las cosas y los datos asociados a ellas son masas amorfas sin sentido. Los macrodatos pueden ayudar a entender y predecir, pero no están libres de sesgos que desenfocan la realidad. Además, la persona y la personalidad no parecen completamente reducibles a datos, por más que algunos de ellos sean textuales. Tampoco lo son la salud, la enfermedad y otros conceptos complejos. Pensar que vamos a ser capaces de gobernar los datos para tomar decisiones tiene un punto de fervor irracional en la capacidad de reducir la vida humana y la complejidad a un algoritmo. El big data puede ser muy útil, claro está, pero este dataismo también puede conducirnos a algunos disparates y despropósitos. Sin ir más lejos, en el campo de la salud.