Sign in / Join

Sobre el machine learning y el big data

¿Cuáles son las implicaciones para la vida humana?

Repasemos...

¿Qué es big data?

El big data es un concepto abstracto que está en boca de muchos en la actualidad. Lo interesante del caso es que en el mundo aún se debate¹ su terminología, para efectos del presente articulo vamos a interpretar como Big Data a un conjunto extenso de datos proveniente de una o diferentes fuentes y de diferente composición que debe ser analizada a gran velocidad para mostrar datos manipulables de cualquier índole en forma amigable en tiempo real.

¿Qué es Machine Learning? eso, ¿con qué se come?

Machine Learning² es una Ciencia —basada en Data Science y otras— que se encarga de la interpretación de datos (Big Data) a partir de formulas matemáticas que permiten que el sistema informático desarrollado realice predicciones a partir del aprendizaje de detección de patrones existentes en los mismos.

Big Data. Imagen tomada de Wired.com

Big Data. Imagen tomada de Wired.com

El Internet de las cosas

Habiendo hecho el anterior breve repaso, veamos: en el mundo interconectado actual, en el que la tendencia mundial es la de conectar cualquier aparato a la Internet (IoT=Internet of Things, por sus siglas en ingles). La generación de datos de consumo —que como vimos genera patrones— está siendo recabada hasta en la más sencilla de las cosas, como por ejemplo, una bombilla.

Supongamos que usted tiene una bombilla "inteligente"(conectada a Internet) en su casa, esa bombilla registra a qué hora, en qué lugar y cuanto tiempo estuvo encendida o apagada. Si le realizamos un análisis de datos y aplicamos algoritmos de ML, esta bombilla sería capaz de auto controlarse a si misma en corto tiempo, aprendiendo de los patrones de consumo de sus usuarios, haciendo de esta manera más eficiente su consumo de energía.

Infografía: Los datos nunca descansan 3.0. (DOMO 2015)

¿Qué hacer con tanta información?

Nunca en la historia de la humanidad, se habían generado tantos datos.  Ahora que ya entendemos un poco más los conceptos anteriores, podríamos vislumbrar posibles escenarios para aplicar estas dos tecnologías al servicio de la ciudadanía. Mediante detección de patrones podríamos mejorar la circulación de vehículos y el encendido y apagado de de lamparas de luz públicas.  En el país, imaginemos los beneficios que podría traer a una institución pública como la CCSS el estudio de patrones de las enfermedades que nos afectan a todos los costarricenses, podríamos prever de mejor manera fechas del año y lugares en los qué se debe distribuir tal medicamento contra tal enfermedad.

El ML podría ser de uso común no sólo en cuestiones domesticas como bombillas o refrigeradoras, sino que abre también todo un mundo de posibilidades para detectar patrones de comportamiento, de consumo, etc.

El MIT (Instituto Tecnologico de Masachussets), se encuentra realizando una recopilación de datos extensa, sobre cómo reacciona el ser humano antes ciertas situaciones morales, en este³ caso en la conducción de vehículos. La idea tras este experimento es poner sobre la mesa discusiones como: ¿Hasta dónde debe llegar la autonomía de las máquinas? En escenarios relativos a vida o muerte de seres humanos, ¿cómo deberían reaccionar las máquinas? Presenta también, una manera ingeniosa de recopilar datos para "enseñarle" a una maquina a detectar patrones humanos.

Otro ejemplo, es el uso cada vez más frecuente de programas y algoritmos de ML para realizar entrevistas, empresas de la talla de Google, Dropbox y otras están migrando cada vez más a utilizar estas nuevas técnicas de reclutamiento que permiten dejar de lado el sesgo del entrevistador hacia un candidato u otro.

Democracia

Tal como sostiene Sampedro (2014): "Los nuevos regímenes políticos podrían encuadrarse en una democracia digital de código abierto, caracterizada por ser transparente y participada. O todo lo contrario. Podríamos avanzar hacia nuevas formas de autoritarismo que superarían los niveles de control social, coerción y represión conocidos hasta ahora. La vía obligada para conjurar esa amenaza reside en incorporar a las instituciones democráticas los principios de la cultura digital abierta y libre".

Encuadrar los gobiernos en democracias digitales pasa por crear instituciones públicas que realicen negociaciones con las gigantescas empresas que operan bajo el internet, tal como se hace en otros medios de "transporte de mercancía" como el aire, tierra o mar. Se torna curioso pensar que el internet sea tan abierto que se encuentra exento de jurisprudencia alguna por parte de la mayoría de estados en donde operan las compañías basadas en comercio de datos, como por ejemplo Google, Facebook y telefónicas alrededor del mundo. Que como vimos, es mucha la información que recopilan sobre sus usuarios.

Para la sanidad de la democracia, se vuelve necesario que el acceso al Big Data generado por sus ciudadanos en todo su territorio, no esté solo al alcance de la operación privada, sino que los datos recopilados de los usuarios deberían ser en primer instancia de uso y manejo exclusivo de cada individuo, quien determinaría qué datos pueden ser públicos y cuáles no, y a partir de ello, entonces podrían hacer uso empresas y gobiernos por igual.

Un verdadero ejercicio real de la democracia, requiere evitar dar pasos hacía atrás como lo ha hecho el gobierno estadounidense al aprobar una ley que facilita la venta de datos privados recopilados por empresas telefónicas sobre sus usuarios.

Como en otros casos, la tecnología está allí, queda en nosotros como ciudadanía determinar (¿o exigir?) su uso correcto. El análisis de datos es algo muy poderoso que sin duda ya está dando de que hablar en el mundo y nos es imprescindible estar informados sobre que le sucede a los datos que generamos minuto a minuto.

*El Autor es Estudiante de Microsoft Data Science Curricula

(1) What is Big Data? Berkeley University, 2014. https://datascience.berkeley.edu/what-is-big-data/
Un conjunto de más de 50 significados diferentes de exponentes en la industria(en Inglés).
(2)What is Machine Learning?  Coursera. https://www.coursera.org/learn/machine-learning/  Significado de Machine Learning, introducción al curso Machine Learning de Stanford University preparado para Coursera.
(3) The Moral Machine. MIT 2017 http://moralmachine.mit.edu/hl/es  experimento en vivo de recolección de datos sobre la moral humana a la hora de la conducción de automoviles.
(4) People analytics. Eduardo Valencia 2017. https://www.linkedin.com/pulse/tres-lecciones-de-google-en-people-analytics-eduardo-valencia
Johao Fabricio Larios