Tecnología 13/10/2019

Walter Sosa Escudero: “¿Quién está ganando con la revolución de los datos? Posiblemente un hacker que estudia nuestros tuits”

Por José Crettaz

El economista habló en #TMTConversaciones sobre su nuevo libro Big data, breve manual para conocer la ciencia de datos que ya invadió nuestras vidas; los desafíos en esta nueva era y el valor de los datos

Walter Sosa Escudero es doctor en Economía, profesor de la Universidad de San Andrés (Udesa) desde su fundación e investigador principal del Conicet. Este 2019 publicó Big data, breve manual para conocer la ciencia de datos que ya invadió nuestras vidas. En #TMTconversaciones definió el big data, explicó su importancia y analizó cómo impacta en nuestra sociedad.

-¿Qué es el big data y por qué es importante?
-Lo más trivial es decir que big data son muchos datos. Si uno se queda con eso piensa que es más de lo mismo, que siempre tuvimos y ahora tenemos muchos datos y entonces estamos mucho mejor. Big data son datos que tienen que ver con interactuar con cosas que están interconectadas como teléfonos celulares, dispositivos GPS y redes sociales. No son datos de una encuesta o de un experimento que tienen una curación.

¿Por qué son importantes? Porque son muchos y hay que tener cuidado, porque no es más de lo mismo. El gran desafío del big data está en eso, son un montón de datos a los que hay que darles una estructura, son importantes porque existen.

-¿Por qué se dice que el big data es el petróleo de este tiempo?

-La analogía funciona desde un punto de vista y no funciona desde otro. Funciona en relación con la fuente de valor y poder que tiene el petróleo. Pero no funciona desde el punto de vista de la escasez. Es un recurso importante pero no escaso, todo lo contrario.

Existe la creencia de que hay pocos actores que tienen ese poder o la capacidad de explotarlo económicamente. Es cierto que lo que primero que se cree es que el poder de los datos está relacionado a instituciones grandes como los estados, Amazon o Google. Big data lo que plantea es una distinción entre tener los datos, tener acceso a los datos y realizar los datos. Big data viene acompañado de un pequeño costado hacker en donde algunos actores pequeños con inteligencia también pueden aprovechar el aluvión de datos.

Siempre planteo este ejemplo: un café de barrio que haga una página web, tenga una cuenta en Instagram y conozca a sus usuarios de Twitter puede implementar una estrategia inteligente para saber qué les gusta y qué no les gusta a sus consumidores.

“Siempre que aparece una tecnología la gente es súperentusiasta o apocalíptica. Toda tecnología viene con promesas y contraindicaciones, esta tecnología nueva de datos nos fuerza a pensar en qué nos beneficiamos y en qué nos perjudicamos”

-¿En qué ámbitos estamos viendo ese uso inteligente de los datos?

-Es algo que llega a todos los sectores. Como están las cosas me cuesta pensar en un sector que no lo haga. Todos los sectores de la sociedad de conocimiento están siendo afectados por la revolución de los datos.

¿Qué ámbitos de la vida están siendo impactados? ¿Qué sectores? Todos. Lo que está pasando ahora que estamos viendo una influencia masiva en cosas un poquito triviales, qué película te gusta, etcétera. De a poco lo vamos ir viendo en cosas más importantes como el sistema educativo o la interacción con la medicina, es todo un poco incipiente.

-En este mundo de los datos hay apocalípticos e integrados. Aquellos que ven una oportunidad enorme en muchos sectores y aquellos que manifiestan que hay un riesgo tremendo

-Siempre que aparece una tecnología la gente es súperentusiasta o apocalíptica. Toda tecnología viene con promesas y contraindicaciones, esta tecnología nueva de datos nos fuerza a pensar en qué nos beneficiamos y en qué nos perjudicamos. Es cierto que los algoritmos tienen problemas éticos operativos y que no podemos ser inocentes con la información, pero también es cierto y justo reconocer que nos vamos a beneficiar muchísimo con algoritmos. La razón por la cual escribí este libro fue para evitar tener una postura apocalíptica pero tampoco hay que ser inocente.

-¿Cómo estamos respecto a la educación para vivir esta realidad de la revolución de los datos?

-Es difícil porque lo que importa es cierta educación para confiar en el otro. Uno toma un remedio y no estudia medicina, pero estudia lo suficiente para confiar en un médico. Lo que hace falta es estudiar lo mínimo para poder confiar o desconfiar sin ser incrédulo. Mucha gente piensa que tiene que estudiar computación, datos, estadística y matemática, lo cual sería extremo. Me parece que eso lo tienen que estudiar los científicos, pero también está en nuestro rol tranquilizar a la gente e intentar contar las cosas como son. Cuando hablamos del sistema educativo se busca lograr una mejor interacción con el mismo y sobre todo con el sistema científico.

-Mencionaste la confianza y la analogía con los medicamentos pero, en ese caso, hay instituciones que velan por esa confiabilidad

-El gran problema que tenemos con esta tecnología de datos es que nos enfrenta a qué tipo de instituciones, reglas y normas tenemos que crear. Algunas son instituciones estatales o leyes, pero otras son instituciones de la sociedad. A veces no hace falta que uno prohíba o permita una cosa, sino educar para que esas cosas no ocurran. La práctica de la medicina es una actividad regulada, el ejercicio de la fe pública a través de la contabilidad es una práctica regulada. La gran pregunta que tenemos es qué cosas tienen que estar reguladas y cuáles no. Lo hicimos con la medicina, con la contabilidad, con la escribanía… Con esto pasa exactamente lo mismo, tenemos que preguntarnos cuáles son las instituciones o las normas sociales o escritas que queremos que los protejan.

“El gran problema que tenemos con esta tecnología de datos es que nos enfrenta a qué tipo de instituciones, reglas y normas tenemos que crear. Algunas son instituciones estatales o leyes, pero otras son instituciones de la sociedad”

-Hay algunos datos e informaciones que tienen que ser privados y públicos ¿Cómo es ese juego? Un empresario podría venderle al estado sin que la competencia sepa cuál es su facturación, pero el estado tiene que difundir esa información porque tiene que rendirle cuentas al ciudadano ¿Cómo es ese balance?

-Va a ser por prueba y error porque implica lidiar con objetivos éticos que son contradictorios, uno es la privacidad y otro la transparencia. En el libro cuento un caso, en Noruega, en donde por una cuestión de transparencia los ingresos de los noruegos son públicos. En algún momento alguien hizo una aplicación que permitía ver los ingresos de todos sus contactos de Facebook, Tinder, o Instagram, lo que provocó que se generaran agresiones y chismes en un pueblo discreto.

En busca de transparencia Noruega quiso que todo estuviese arriba de la mesa, pero en pos de la privacidad a un mes levantó el guante. Nos toca encontrar cómo negociar objetivos éticos y discutir cosas que implican objetivos éticos contradictorios.

-¿Quiénes son los dueños de los datos? ¿Google, Facebook o las personas que generamos esos datos?

-Cuando era chico andaba con mi disco bajo el brazo y no distinguíamos quién era dueño de la música. En esa época, tener los discos era tener acceso. Ahora ando con el catálogo entero de Sony Music en Spotify. La revolución del big data plantea una enorme distinción entre tener acceso, tener los datos y sobre todo analizarlos.

Así como están las cosas es un tanto irrelevante la discusión de quién tiene los datos, a la luz de quién tiene acceso y quién no. ¿Quién tiene mis tuits? ¿Los tengo yo o Twitter? Un programador, con un poquito de habilidad informática, tiene acceso a mis tuits y a la posibilidad de analizarlos. Si la pregunta es quién está ganando posiblemente sea un hacker que estudia mis tuits. Muchas veces pasa, paradójicamente, que quien tiene los datos no gana más. Por ejemplo, el caso de Manuel Aristarán en Bahía Blanca y su proyecto Gasto Público Bahiense. El gobierno en pos de transparencia puso sus datos disponibles pero eran ilegibles, entonces Manuel diseñó un bot muy simple que permitió visualizar el gasto público. El héroe de la película terminó siendo alguien con la habilidad de interpretar esos datos, junto con la voluntad del gobierno de publicarlos.

-Entonces el producto valioso es el sentido que producen los datos y en la habilidad de generarlos

-Totalmente. Los datos empiezan a decir cosas interesantes cuando uno tiene una pregunta concreta. Los datos no anteceden a las preguntas ni las preguntas a los datos, hay una circularidad en donde los datos interactúan con las ideas. Le sacas las ideas a los datos y éstos no dicen nada.

-¿Se puede manipular lo que piensa una sociedad o un individuo manipulando los datos?

-Sí, pero no creo que en un 100%. Ciertamente se puede influir pero eso no es nuevo, desde Sócrates en adelante estamos intentando meternos en la cabeza de otros. Lo que mucha gente se pregunta es si se puede hacer de forma subliminal y ahí la respuesta es sí, pero no creo que seamos tan tontos. Yo no creo que lo que está pasando con las elecciones, en ningún país, tenga que ver con que gana quien tiene más big data y analytics.

“Los datos empiezan a decir cosas interesantes cuando uno tiene una pregunta concreta. Los datos no anteceden a las preguntas ni las preguntas a los datos, hay una circularidad en donde los datos interactúan con las ideas. Le sacas las ideas a los datos y éstos no dicen nada”

-¿Se puede predecir el comportamiento de una sociedad o de un individuo estudiando sus datos?

-En parte sí y en parte no. Como seres humanos somos tremendamente predecibles y, de otro punto de vista, somos un enorme misterio y está buenísimo que así sea. Se puede predecir todo aquello que es un patrón, ciertas características como por ejemplo dónde vivís, cómo son tus hábitos, tu gusto por la pizza, etc. Pero, a quién vas a votar o a cuánto va a estar el dólar de acá a tres días, son cosas complicadas de predecir no por complejas sino por la estrategia. Es difícil predecir lo que va a decir [el presidente] Macri porque lo que vaya a decir depende de lo que crea que [el candidato opositor Alberto] Fernández va a decir, y así sucesivamente. Esa interacción estratégica es lo que explica el “fracaso” del big data. Lo que fracasa no son las encuestas ni el big data sino del análisis. Son eventos estratégicos sujetos a estas fluctuaciones que dependen de lo que yo hago, de lo que hace el otro y lo que pensamos. No es impredecible porque no tenemos suficientes datos, sino es impredecible porque en su naturaleza es así.

“Lo que fracasa no son las encuestas ni el big data sino del análisis. Son eventos estratégicos sujetos a estas fluctuaciones que dependen de lo que yo hago, de lo que hace el otro y lo que pensamos”

-Hay gente a la expectativa del fracaso de estas nuevas herramientas o realidades

-Lo que nos toca a nosotros es romper esta visión binaria de que es el fin del universo o de que es otra cerveza artesanal. Yo no esperaba que el big data tuviese una influencia en las elecciones, y espero que no lo tenga. Hay ciertas cosas cuya complejidad no tiene que ver con la falta de datos y otras cosas que sí. Se trata de ver qué tiene de bueno y qué tiene de malo para sacar correctamente la cuenta.

-¿Hay un sólo planeta para el big data o hay una geopolítica de los datos en el que hay naciones subdesarrolladas y desarrolladas, unas condicionando a otras?

-Sí. Es cierto que hay más recursos en países muy desarrollados, pero también es cierto que en este costado hacker del big data hace que regiones relativamente pobres puedan beneficiarse enormemente de este tipo de estrategias.

-¿Por qué es importante la comunicación en el tema del big data?

-Se habla ahora de ciencia de datos como si fuese algo nuevo pero es un nombre nuevo para lo que era la estadística, la computación y la matemática. Hay mucha gente que dice que big data es un nombre simpático que han inventado, pero si la ciencia de datos tiene chance de existir, más allá de la estadística, es un proceso integrador de cosas que estaban muy estancas. Antes nosotros veíamos el proceso de análisis de datos de forma separada. Un buen equipo de ciencia de datos cumple todos los roles interactivamente: tiene las ideas, busca los datos, los procesa, y los comunica.

Todo proyecto de ciencia de datos comienza con alguien comunicando algo con alguna idea y termina con alguien comunicando porque quiere conversar, quiere bajar el miedo, etcétera. Me reconforta ver gente de las ciencias duras estudiando el lenguaje visual, cómo comunicar efectivamente y cómo escribir. También me reconforta ver gente de la antropología, la sociología y la política incorporando herramientas de programación. La comunicación es una parte súper estratégica en los procesos de ciencia de datos.

“Hay mucha gente que dice que big data es un nombre simpático que han inventado, pero si la ciencia de datos tiene chance de existir, más allá de la estadística, es un proceso integrador de cosas que estaban muy estancas”