This graph shows how many times the word ______ has been mentioned throughout the history of the program.
Esteu escoltant Generació Digital i ho feu perquè esteu sindicats al nostre podcast
o potser perquè heu escoltat el programa d'aquesta setmana
on hem parlat amb Fernando Cotxieti,
que és cap del grup de visualització científica
al Barcelona Supercomputing Center.
Molt bon dia.
Hola, què tal, molt bon dia.
A la passada edició del Sónar Més D,
la Barcelona Supercomputing Center va fer un experiment
al Sónar de dia
i ahir, precisament, es va presentar,
diguéssim, les conclusions d'aquest experiment.
Fernando, Sónar és un evento perfecte
per a l'estudi del moviment de les persones, diguem-ne.
Sónar és un laboratori fantàstic
perquè és moltíssima gent
amb unes activitats que no són les de tots els dies
però que són interessants d'entendre
i molta gent amb ganes de tenir-se a prop de la tecnologia
i que s'aprenen a jugar amb els experiments, a participar.
Així que sí, és un gran ambient per a aquest tipus de coses.
El experiment va sobretot de dades.
En alguna entrevista que te han hecho
i que està en YouTube, por ejemplo,
tu fas molta importància a la representació de les dades.
És a dir, moltes vegades es parla del big data
i moltes vegades, quan jo veig, per exemple, un estudi,
com el que heu fet vosaltres,
la representació, a vegades, és molt complicada
i tampoc et dàs compte de la importància d'aquest estudi, per exemple.
Aquesta és una part important del big data?
La parte de la representación visual es importante
en todo lo que es la ciencia.
En el big data, a veces más,
porque la cantidad de datos es tan grande
que es muy abrumadora que es difícil de hacer conclusiones
simplemente con una inspección de los números directa.
Entonces, allí es cuando recurrimos a ponerlos de una manera visual,
expresarlos, representarlos de una manera
que podamos interpretarlos y mirar patrones
y encontrar estos patrones, respuestas a las preguntas,
de manera más fácil.
Somos muy buenos nosotros, biológicamente,
para interpretar estas cosas, para verlas, las respuestas.
No los números tantos, sino la parte de los algoritmos.
El big data tiene una parte que es lo que mucha gente entiende,
digamos que es que hay por detrás muchos algoritmos
que son capaces de procesar y almacenar
y lidiar con tantos datos.
Y estos algoritmos pueden sacar conclusiones,
pero muchas veces las respuestas de los mismos algoritmos
no son sencillas, no son un sí, no,
sino que son, a veces, un conjunto de decisiones a tomar
y que son mejores representadas visualmente
para que el humano pueda entender la respuesta de lo que ha salido.
En el sonar pusisteis una serie de sensores, ¿no?
Exactamente, en el sonar pusimos unos sensores
que detectaban la presencia de móviles a través de la señal de Wi-Fi.
Estaban los móviles que llevaban la Wi-Fi encendida,
están todo el tiempo enviando señal,
buscando redes conocidas o para conectarse,
y allí es cuando nos podemos escuchar.
Simplemente es una transacción bastante inocua
y que ocurre todos los días en todos los sitios donde caminamos
nuestros móviles por las calles,
están intentando conectarse a las redes de la gente
que vive en esa misma calle y nosotros no nos enteramos.
Y tampoco es que puedan sacarnos mucha información con eso,
pero nosotros nos aprovechamos de este pequeño sistema
para identificar cada uno de estos móviles
y así perseguir a la gente,
hacer un seguimiento del recorrido de la gente a lo largo de la zona.
Y por lo que dices, es transparente, es decir,
todos participábamos allí, ¿no?
Sí, bueno, la gente que llevaba el Wi-Fi apagado no.
Ya, exacto.
Eso no, pero mucha gente que pasaba por el booth,
que se enteraba de lo que estábamos haciendo,
les encantaba mucho y encendían el Wi-Fi
para que a partir de allí pudiéramos saber qué hacían,
porque además les dábamos a la gente la posibilidad de ingresar
la dirección de su teléfono, la dirección de Macadre,
se llama, del teléfono,
y el sistema podía darles la trayectoria individualizada
que ellos habían tenido en sus pies.
¿Se puede aprender mucho de la sociedad
con la visualización de estos datos?
Sí, con la visualización y el análisis de los datos
podemos entender muchísimas cosas de nuestro comportamiento.
Hay que recordarse que es mucho más importante
tener una evidencia cuantitativa que nuestra intuición,
que nuestra percepción muchas veces nos engaña
y recordamos las cosas de una manera que nos conviene
o que está influenciada por cosas que no nos damos cuenta
que está haciendo así.
Entonces, los datos nos permiten analizar nuestro comportamiento
y sacar muchísimas conclusiones que no sabíamos que estaban
o que a veces resultan obvias cuando nos lo explican,
pero de antemano no hubiéramos podido predecir eso.
Yo creo que sí, la visualización es una herramienta más de esto.
La visualización es una herramienta muy guapa
en la que hacemos nosotros y todo eso,
pero hay por detrás otras partes que son la parte de las analíticas de datos
con algoritmos y con procesados automáticos.
Y imagino que al sonar estos datos le deben haber ido muy bien,
porque puede ver el comportamiento de la gente
en un espacio como Sonar más D, ¿no?
Yo creo que sí, en los de Sonar había algunas conclusiones
que les gustaron mucho, algunos detallitos que extrajimos.
Esto fue un experimento, no es a un nivel industrial
en el cual pudimos extraer una cantidad de información tan grande
como la que saca un sitio web que analiza nuestro comportamiento
de compras durante mucho, mucho tiempo o de lectura
como ocurre con sitios de compras como Amazon y todo esto,
que nos estudian mucho, a ver dónde hacemos click,
cuánto tiempo pasamos leyendo cada cosa.
Nosotros hicimos alguna profundidad del estudio,
sacamos algunas conclusiones que les interesaron mucho.
Algunas, como digo, en perspectiva resultan bastante evidentes,
como sí, claro, sabíamos que eso tenía que pasar
porque lo diseñamos así.
En ese caso sirve como confirmación que, bueno,
si lo diseñaron así funcionó.
Y en otro caso sí pudimos extraer algunas conclusiones divertidas,
por ejemplo, con lo que fue el análisis del ranking de los artistas,
por decirlo así.
Ajá.
Hicimos un, como se pueden hacer 50 personas,
puedes hacer un ranking por el tamaño del avión.
Claro.
Todo el mundo, ¿no? Un aforo.
Pero nosotros sabíamos mucho más de esta gente,
nosotros sabíamos de dónde venían,
nosotros sabíamos que habían visto antes,
nosotros sabíamos que habían estado en esa sala donde ocurrió el show,
todo el día y no se movieron,
así que probablemente el show que vieron era uno más,
o si fueron a zonas nada más que para ver a ese artista.
Qué bueno, qué bueno.
Claro, y luego, por supuesto, si estuvieron allí cinco minutos
o si vieron la barra completa,
lo que la gente de marketing llama el engagement de la audiencia.
Entonces podemos medir eso
y lo que sacamos fue un ranking muy diferente del ranking
simplemente midiendo la audiencia.
Hubo algunos artistas que resultaron muy importantes
para alguna gente que estuvo en el SESTIVAL.
Eso creo que es una conclusión que les gustó mucho.
¿Hasta qué punto es importante hacer ese trabajo
en un sitio como el que estáis,
donde tenéis un ordenador fantástico en un sitio fantástico
que cada vez que vamos...
Yo digo, la verdad es que es precioso ver ese ordenador
en el sitio donde está.
¿Es importante hacer ese trabajo
en un ordenador tan potente como el vuestro?
Creo que sí, porque los ordenadores estos muy grandes
vienen de una historia de ya varias décadas
en las cuales se utilizan exclusivamente
para cómputos de ecuaciones,
para solucionar problemas científicos
que se pueden expresar en términos de ecuaciones,
modelos matemáticos, muy difíciles de resolver
y que hacen falta grandes, grandes ordenadores
para poder solucionarlos.
Pero últimamente, en los últimos 10, 15 años,
es que nos hemos enfrentado con que existe otro nuevo paradigma
en el cual podemos extraer conclusiones
y conocimiento muy, muy valioso,
que es el de la minería de datos, el big data.
Lo que nos provee es de una manera diferente,
un modelo de ciencia diferente de la simulación numérica
con el que estos superordenadores funcionan.
Entonces, Maren Ostrum y el centro nuestro
están un poco migrando hacia este nuevo paradigma,
a cambiar un poco la manera en que trabajamos
y las infraestructuras que tenemos
para aprovecharnos de estas cosas sin perder lo otro,
que todavía es muy útil, pero complementarlo
y hacerlo funcionar junto con esta nueva manera
de extraer información.
Por último, Fernando, todo esto que estás contando
de esta nueva forma de procesar los datos,
¿siempre es a nivel social, de sociedad, de gente moviéndose,
o hay otras aplicaciones, no sé, me imagino,
médicas o científicas diferentes?
Muy buena pregunta, porque precisamente de eso
van algunos proyectos que tenemos ahora
que todavía no salen en la prensa
porque algunos están comenzando y otros porque no tienen
el caché cultural de un evento como Sonar.
Pero, por ejemplo, este mismo tipo de estudios
se pueden hacer sobre grandes, grandes cantidades de pacientes,
información y datos de grandes, grandes cantidades de pacientes,
pruebas médicas, pruebas médicas automatizadas,
sobre pequeños pedazos de tejido, sobre el tipo de tecnologías
con las que se revolucionó la genética,
que es como el microarray ahora,
se pueden utilizar estas cosas acopladas a simulaciones de órganos,
que es un proyecto que hacemos aquí en el centro de la computación,
para poder predecir cómo va a reaccionar un medicamento
con un paciente específico, por ejemplo,
como para poder hacer la medicina, tiene mucho que ganar de esto.
Y, por otro lado, otras cosas que hacemos le valen mucho a la industria,
porque este tipo de recolección de datos y extracción de conclusiones,
información y patrones, lo aplicamos también a la industria
y a las maquinarias que son muy grandes y muy complejas,
que tienen cientos de sensores que miden cosas muchas veces por segundo.
Estas máquinas a veces son bichos con su propia personalidad,
entonces son difíciles de mantener en un régimen óptimo
en el cual consumen menos y tienen máxima productividad
o contaminen menos el tipo de cosas que nos preocupan en estos días ahora.
Y nosotros con estas técnicas podemos hacer este tipo de estudios,
podemos tomar toda esta cantidad ingente de datos
y sacar un sistema que es capaz de entender el sistema
y darnos respuestas sin tener que ir a tocar la máquina
y poder manejarla a esta máquina de una manera mejor.
Por último, ya ahora se acabó, muchas veces cuando hablo con personas,
recuerdo en una de las últimas exposiciones en el CSCB
que se llama Big Bang Data,
donde veíamos precisamente todo este trabajo que se hace,
muchas veces el pero que hay es de,
¡ostras, es que nos tienen controlados hasta el movimiento!
¿Os pasa a veces que el Big Data también tiene,
acarrea un problema en el tema del control?
Nuestro proyecto iba un poco para levantar visibilidad
en alguno de esos aspectos,
que sí, el Big Data y la tecnología nueva,
el internet y todo esto, tiene un pequeño lado oscuro.
El problema que hay es que avanza demasiado rápido
como para que la legislación pueda seguirla.
Y uno de los problemas más conocidos, por ejemplo,
es la de la pérdida de prioridad que tenemos.
O sea, para muchos de estos datos sociales,
en cierta manera se nos invade,
o incluso cuando nos avisan de que vamos a recopilar estos datos
y usarlos para algo,
no queda muy claro de cuánto vale lo que estamos pagando.
Las grandes redes sociales como Facebook y Google,
ellos viven de nuestros datos,
ellos viven de la información que nosotros les damos gratis,
y nosotros, al cambio, recibimos algunos servicios.
Por ahora estamos todos muy contentos de utilizar nuestros servicios,
yo mismo, también, no es que sea muy paramèrico,
los uso y sé que usan mis datos para algo,
pero todavía no está muy claro de dónde están los bordes,
hasta dónde vamos a permitir que se use nuestra información
para qué cosas y hasta dónde vale eso.
¿Estaríamos dispuestos a vender servicios a cobrar, por ejemplo?
Esta es una discusión que está muy caliente hoy en el mundo
y que va a complicarse cada vez más,
porque la tecnología se va poniendo cada vez más avanzada.
Molt bé, doncs hem parlat amb el Fernando Cuccietti,
que és cap del grup de visualització científica
del Barcelona Supercomputing Center.
Moltíssimes gràcies per aquesta conversació,
suerte i no dudéis en poneros en contacte amb nosaltres,
ja us seguirem amb tots aquests estudis
que segur que iran saliendo en los próximos meses.
Molt bé, moltíssimes gràcies, avísaremos de tot.