Los grandes volúmenes de datos que recolectamos y analizamos en la actualidad tienen consecuencias en las vidas de personas.
La creación de datos parece ser una inclinación natural del ser humano; desde las pinturas rupestres de Lascaux en Francia hasta las 80 millones de fotos que se publican a diario en Instagram, parece ser una necesidad básica dejar rastro de nuestra existencia. Los datos y la información han existido desde el principio de la civilización, lo que ha cambiado significativamente es el volumen.
El volumen es la primera de las “tres Vs” (volumen, velocidad y variedad) empleadas por los expertos para definir el concepto de Big Data. Estamos hablando de volúmenes masivos de datos que simplemente no pueden ser procesados por métodos tradicionales; es aquí donde se utilizan unidades como los Terabytes (un billón de bytes) y Petabytes (mil billones de bytes).
Estos números no son ninguna sorpresa tomando en cuenta que todas nuestras actividades digitales generan datos. Cada segundo que estamos utilizando computadoras y dispositivos móviles estamos generando datos, una variedad de datos para ser más exactos. Variedad es la segunda de las Vs del Big Data. Los datos no son solamente números; son fotos, videos, audios, interacciones sociales, etc.
Al parecer todo está pasando cada vez más rápido; velocidad es la tercera característica del Big Data. Los datos se generan y necesitan procesarse muy rápido, a veces hasta en tiempo real.
Sin embargo lo que puede perderse entre los volúmenes, velocidad y variedad es la humanidad detrás de los datos.
“La mayoría de las definiciones de Big Data no toman en consideración su humanidad inherente, ni tampoco abordan significativamente sus implicaciones en la relación entre la tecnología y las formas cambiantes en las que nos definimos”.
Rebecca Lemov, Profesora de Historia de la Ciencia en Harvard
Pero aun peor que olvidar el elemento humano que compone los datos, es utilizar los mismos en contra de las personas.
Grandes datos conllevan grandes responsabilidades
Como sucede con cualquier avance tecnológico, Big Data posee el potencial tanto para el bien como para el mal. Las enormes cantidades de datos ayudan a las empresas y organizaciones a identificar áreas de oportunidad, reducir costos y mejorar la toma de decisiones. Pero todos estos beneficios tienen un precio.
Una de las principales preocupaciones asociadas al tema de Big Data es la privacidad. El monitoreo y análisis constante de cada una de nuestras actividades e interacciones puede resultar algo preocupante. ¡Y esto seguirá creciendo! Los expertos pronostican que cada vez habrá más dispositivos y objetos conectados a la red, lo que significa más invasiones a nuestra privacidad.
No podemos negar la importancia de abordar el tema de la privacidad en la era del Big Data, pero también existen otros temas, tal vez menos evidentes, que pueden resultar mucho más inquietantes y nocivos.
Otro peligro que debemos explorar se encuentra oculto en procesos utilizados para analizar la cantidad masiva de datos, el algoritmo. Un algoritmo utiliza reglas e instrucciones definidas y ordenadas para ejecutar una actividad. Por lo general pensamos en los algoritmos como instrumentos perfectos e incorruptibles, pero la realidad es que los algoritmos son definidos por humanos y por lo tanto son susceptibles a prejuicios y errores.
La fe ciega en los algoritmos
Cathy O’Neil, doctora en Matemáticas de la Universidad de Harvard y autora del libro Weapons of Math Destruction (Armas de Destrucción Matemática), ha sido testigo de los efectos devastadores del Big Data.
O’Neil trabajó como analista en Wall Street pero decidió abandonar el mundo de las finanzas y convertirse en activista al darse cuenta del daño causado por los modelos estadísticos durante el desastre hipotecario de Estados Unidos.
La autora argumenta que los algoritmos no son objetivos e imparciales y que éstos pueden ser codificados, consciente o inconscientemente, con prejuicios que pueden llegar a promover la desigualdad. Debido a que la población general no posee un alto conocimiento matemático, la mayoría simplemente acepta los algoritmos como verdades irrefutables y confía ciegamente en ellos.
Un ejemplo que nos da O’Neil donde podemos percibir los prejuicios de los algoritmos es el siguiente:
Imaginemos que una empresa está teniendo una alta rotación de ingenieros y por lo tanto decide utilizar un algoritmo para mejorar su proceso de reclutamiento. Al crear el algoritmo la empresa debe definir lo que considera como un resultado exitoso; en este caso el éxito se define como un ingeniero que dura más de dos años en la empresa y que recibe al menos un ascenso durante este período. Finalmente se utilizan los datos históricos de la empresa para “entrenar” al algoritmo. Supongamos que durante la historia de la empresa ninguna ingeniera ha durado más de dos años en su puesto, el algoritmo automáticamente va a descartar todos los CVs de mujeres basándose en este patrón.
“Como los algoritmos son considerados ‘matemáticamente sofisticados’, y las personas no se consideran ‘matemáticamente sofisticadas’, ellos sienten que no tienen el derecho de cuestionar estas cosas”.
Cathy O’Neil
Este ejemplo nos demuestra una verdad fundamental: los algoritmos detectan patrones pero no los entienden. Lo que O’Neil propone entonces es un poco de escepticismo ante el fenómeno del Big Data y que no nos dejemos llevar por sus promesas. Además, ella también nos invita a cuestionar los algoritmos (aunque no tengamos un doctorado en matemáticas) y que busquemos entender los modelos estadísticos que están siendo utilizados, especialmente cuando pueden tener un impacto directo en nuestras vidas.
Aprendiendo a vivir con Big Data
Ante la evidencia negativa que encontramos contra el uso de Big Data, ¿qué camino podemos tomar? Los expertos afirman que el Big Data no va a desaparecer, al contrario, éste se volverá aún más omnipresente. Antonio Conde, Director de IoT y Transformación Digital en Cisco España, explicó que los datos son “el nuevo petróleo” y que éstos se están convirtiendo en piezas clave de la sociedad y la economía. Big Data parece ser inevitable, pero este hecho no debe llenarnos de pesimismo.
Nuestra salvación, argumenta la profesora Rebecca Lemov, es generar consciencia acerca de Big Data y nunca olvidar su componente humano.
“Es necesario mantener en mente que los datos no son solamente generados acerca de individuos, sino que también están hechos de individuos. Son datos humanos”.
Rebecca Lemov
Por su parte Cathy O’Neil aconseja a todas las personas que trabajan con Big Data a tomar muy en serio los aspectos éticos aunque esto represente un gran reto. Para el público general, el consejo es tener el valor de cuestionar los algoritmos cuando sea necesario y recordar que la correlación en los datos no necesariamente implica causalidad.
“Todas las licenciaturas en informática y todos los programas académicos de ciencia de datos deben incluir ética, absolutamente”.
Cathy O’Neil