This graph shows how many times the word ______ has been mentioned throughout the history of the program.
¿No te ha pasado alguna vez que, tras tener una conversación privada en la que mencionabas
una determinada marca o producto comercial, justamente después has recibido a través
de internet una publicidad en la que aparecÃa ese mismo producto?
Si no te ha ocurrido, seguramente habrás escuchado a alguien que sà le ha pasado,
y si no, seguramente en algún momento te habrás hecho esa pregunta que todos nos hacemos.
¿Nos escucha Google a través de nuestros dispositivos?
Vivimos en la era de la información, en la sociedad del conocimiento y en las economÃas
de los datos.
Tras vivir una tercera revolución marcada por el salto de lo analógico o digital, la
tendencia actual es la de monitorizar y analizar toda aquella fuente de datos que se apropensa
tener valor.
Tiene sentido, con la aparición de nuevos algoritmos de inteligencia artificial basados
en el deep learning, tenemos las herramientas necesarias para poder analizar hasta el más
mÃnimo patrón contenido en nuestros datos y que pueda ser de valor para las empresas.
En esta lÃnea es normal, por tanto, que cada vez más empresas se sumen a invertir en este
sector buscando estrategias que les permitan extraer la mayor cantidad de datos de sus
usuarios.
Seguramente todos conozcamos la famosa frase que dice, si el producto es gratis, es que
entonces tú eres el producto.
Claro, con esta filosofÃa presente, el consumidor se encuentra cada vez más ante un conflicto
de intereses, porque la tecnologÃa poco a poco se vuelve más ubicua, y la tendencia
es que cada vez llenemos nuestra vida de más y más dispositivos inteligentes, que
nos aporten cada vez más funcionalidades de las cuales nos volvemos más dependientes.
Pero al mismo tiempo, esto lo hacemos sacrificando algo a lo que cada vez estamos dando un mayor
valor, nuestra privacidad.
Por suerte la sociedad cada vez es más consciente de esto, y cada vez son más las personas
que se preguntan hasta qué punto las organizaciones se mantienen en el terreno de lo ético y
lo legal a la hora de obtener información de sus usuarios.
En este sentido, recientemente he escuchado con mayor frecuencia un caso que pone esto
de manifiesto, y es la pregunta que queremos resolver hoy ¿Nos escucha Google cuando tenemos
conversaciones privadas?
La estrategia tiene sentido, porque al final Google no deja de ser una gran empresa de
publicidad que intenta conectar tanto a anunciantes como a consumidores, haciendo uso de toda
la información registrada de sus usuarios para asà hacer marketing personalizado.
Al mismo tiempo, Google provee el sistema operativo del 72% de los dispositivos móviles
del mercado y cada vez suma más productos a su cartera, como altavoces inteligentes,
portátiles o tablets.
No solo eso, también cuentan con los algoritmos de inteligencia artificial más avanzados que
van a ser necesarios para analizar toda esta cantidad en gente de datos.
Entonces siendo asà y teniendo todos los recursos necesarios, ¿tiene sentido analizar
las conversaciones privadas e intentar buscar aquellos elementos que sean interesantes para
dar publicidad verdad?
Vale, vale, vale, a nivel comercial puede que tenga sentido, pero en serio, ¿de verdad
tú te crees que Google va a tener todo el dÃa el micrófono activado en todos tus dispositivos
para escuchar tus conversaciones privadas?
Pues sÃ, como oyes, y bueno, como oye tu dispositivo móvil, pero tu móvil, tu portátil, tu tablet
y tu altavoz inteligente, todos te escuchan todo el rato, pero es que esto tiene sentido
realmente.
Cada vez que tú te quieres comunicar con tu asistente virtual, tú tienes que lanzar
una orden de comando, como por ejemplo Day City, Ola Cortana o K-Google.
Tu dispositivo precisa de estar constantemente con el micrófono activado para que asà sus
modelos de reconocimiento por voz puedan saber en qué momento tú has lanzado la orden
de activación y luego escuchar el resto de instrucciones.
Si el micrófono no estuviera activado siempre, ¿cómo podrÃa el dispositivo escucharte
de primeras?
Bueno, vale, sÃ, en ese caso sà tiene sentido que el micrófono siempre esté activo, pero
una cosa es que te esté escuchando y otra muy diferente es que esos audios estén registrando,
almacenando y analizando, ¿verdad?
Pues eso es lo que está ocurriendo.
Quizás de esto no todo el mundo sea consciente, pero por defecto tu dispositivo Android hace
un registro y almacenamiento en la nube de todos los clips de audios en los que alguna
vez a lo largo de tu vida has dicho K-Google, ¿no me crees?
Puedes comprobarlo.
Si accedes a esta web de aquà podrás ver cómo se han ido almacenando todos los comandos
de voz que tú le has dicho a tu sistema virtual mes tras mes y año tras año, todos disponibles
para escuchar.
Ok Google, ¿cómo puedes activar el comando de voz Ok Google?
Personalmente la primera vez que me encontré con esta página me impactó bastante al poder
escuchar comandos de voz que habÃa lanzado años atrás y que la mayorÃa ni recordaba,
y de poder recuperar momentos que habÃan quedado en el pasado con amigos de hace años
y que han quedado atrapados en los servidores de Google.
Además, si se dan cuenta, aquà podemos comprobar efectivamente cómo las grabaciones incluyen
un pequeño trozo de audio del momento previo a decir la frase Ok Google.
Ok Google, ¿cómo puedes activar el comando de voz Ok Google?
Demostrando esto que el micrófono sà registra incluso el audio previo a la orden de activación.
Vale, sà es cierto que Google mantiene el micrófono abierto y que almacena aquellas
conversaciones que tú tienes con tu asistente virtual.
Pero esto realmente no quiere decir que Google esté analizando las 24 horas del dÃa aquellas
conversaciones que tú mantienes en privado para mejorar su sistema de publicidad.
Creo que para responder a la pregunta que nos hemos planteado en este vÃdeo, lo primero
que tendrÃamos que abordar es si Google realmente tiene la capacidad técnica para hacer este
análisis.
Y ahà ya nos estarÃamos metiendo en el apartado más técnico de este asunto y el que se
relaciona más con la temática de este canal, porque como ya he dicho antes, analizar todas
estas conversaciones a la búsqueda de publicidad que mostrarte no es una tarea sencilla y requiere
hacer uso del machine learning, la inteligencia artificial, para resolver los diferentes desafÃos
que este problema plantea.
Vamos a ver cuáles son.
El principal problema a resolver es el propio reconocimiento por voz y su conversión a
texto, y esto es una tarea que Google es capaz de solucionar con creces.
Los modelos utilizados por Google son tan potentes que reconocen tu voz y la transcriben
a texto, sin importar si estás cerca o lejos o en ambientes con poco o mucho ruido.
Además, el ruido ambiental ya no es importante, porque Google demostró recientemente cómo
haciendo uso de la inteligencia artificial, habÃan conseguido discriminar la voz de una
persona del ruido de su entorno perfectamente.
Pero claro, no solo serÃa reconocer la voz de una persona en un audio, sino que durante
nuestro dÃa a dÃa tenemos conversaciones con varias personas diferentes, cuya voces
se entremezclan, solapan e interrumpen.
Este problema también está muy estudiado y se conoce como el efecto de la fiesta de
cóctel, y este es otro problema que Google ya ha resuelto siendo capaz de discriminar
los diálogos de cada persona en una conversación de manera individual.
Vale, parece que Google no tiene problema con esto, pero es que todavÃa no hemos resuelto
todo el problema.
Y es que una vez que tenemos transcrita todas las conversaciones, lo siguiente que tendrÃamos
que hacer serÃa entender su contenido, la semántica de las frases.
Y claro, este es un problema más complicado.
Esta tarea pertenece al área del procesamiento del lenguaje natural, y aunque se siguen produciendo
avances año tras año, todavÃa no hemos alcanzado unos niveles aceptables que nos
permitan entender el significado concreto de una frase, y menos aún analizando la naturaleza
desestructurada de una conversación de horas en las que han participado varias personas.
Además, a este problema se le combina otro que es el análisis de sentimiento, es decir,
identificar cuál es la emoción asociada a una frase determinada, alegrÃa, rabia,
tristeza, ironÃa, porque claro, al final no es lo mismo decir, ¡uy sÃ, qué bien,
qué gana de comer en un italiano! que decir, ¡uy sÃ, qué bien, qué gana de comer en
un italiano! ¿Te das cuenta?
La información contenida en la entonación de una frase es clave para romper la ambigüedad
de las palabras, y también será clave a la hora de proponerte un anuncio personalizado.
¿Y consigue esto Google? Pues probablemente todavÃa no. Y no me entiendas mal, seguramente
tengan los modelos más avanzados y a los mejores ingenieros en nómina trabajando en
este problema, pero aún asà podemos encontrar ejemplos donde vemos que todavÃa esto no
lo tienen dominado. Podemos comprobar fallos a la hora de detectar la entonación en el
habla en la misma herramienta que veÃamos antes, capaz de transcribir voz a texto sÃ,
pero incapaz de inferir por tu entonación los signos de puntuación.
Otro ejemplo lo podemos encontrar en YouTube, donde solo hace falta ver cómo funciona el
algoritmo cuando por ejemplo analiza vÃdeos de compañeros divulgadores de historia en
los que se habla de la segunda guerra mundial. Estos son filtrados como contenido con violencia
al detectar en sus transcripciones de audio palabras como, bueno, estáte aquà que no
pienso decir. En estos casos el audio se transcribe correctamente a texto, pero es en su análisis
semántico donde el algoritmo de YouTube encuentra limitaciones que hacen que no pueda entender
el contexto en el que surgen estas palabras. Claramente es en este eslabón en todo el
proceso de análisis donde yo veo que Google tiene la mayor dificultad a la hora de encontrar
aquellos elementos que pueden ser interesantes para un anuncio. Si Google no puede analizar
la semántica de nuestras frases, en ningún momento podrá entender si nos estamos refiriendo
una marca de forma positiva o negativa, y por tanto no sabrÃa qué publicidad nos tendrÃa
que enseñar. Este es, por tanto, un primer argumento que desde la perspectiva técnica
refutarÃa esa idea de que Google espÃa nuestras conversaciones.
Pero Carlos, a ver, si yo he visto en internet un vÃdeo de un tipo que en inglés dice
¨Voy a comprar productos para perros¨ y automáticamente le salen productos para perros.
Oh my god! Claro, porque realmente serÃa extraño pensar
que este vÃdeo pueda ser un fake preparado, y bueno, porque realmente en internet es raro
encontrarse casos donde haya gente que quiera llamar la atención mediante la viralización
de contenidos sobre fenómenos extraños, paranormales, conspiranoicos, y que además la gente tiene
la capacidad crÃtica suficiente como para no viralizar contenidos y saber cuándo algo
es verdad y cuándo algo es mal… ¿11 millones de views? ¿En serio?
Mira, mirad, mirad, el boli, el boli paranormal, mirad cómo se dobla, el boli paranormal.
No funciona, ¿verdad? No da igual. En cualquier caso, si esto fuera asÃ, Google
en Europa se estarÃa regiendo bajo la nueva ley de protección de datos europea, y en
ese caso tendrÃan que hacer disponible toda aquella información que almacenen de sus
usuarios. Claro, yo en ningún lugar he visto, por ejemplo, como pasa con los clips de las
conversaciones con el asistente virtual, que ellos te den acceso a todas las conversaciones
que tú tienes durante un dÃa. Por tanto, de no hacerlo, esto serÃa ilegal. Pero claro,
si estuvieran haciendo algo ilegal, serÃa extraño que pudiera demostrarse de una forma
tan sencilla como hemos visto en el vÃdeo de los animales, ¿verdad?
Aún asÃ, como es muy fácil hablar y no hacer, no he querido dejar este análisis
incompleto, y por tanto he hecho el experimento. Durante los últimos dÃas he estado realizando
de forma repetida conversaciones en español y en inglés, donde mostraba mi interés por
comprar una serie de productos que habÃa seleccionado al comienzo de la semana. Productos
como un telescopio, un portátil de la marca Lenovo, o por ejemplo productos para perros,
como hacÃa nuestro amigo del vÃdeo anterior. Al mismo tiempo he ido registrando toda la
publicidad que se me ha anunciado durante esta semana mientras navegaba tanto por YouTube
como por internet, para asà poder identificar si se producÃa algún cambio que fuera interesante.
¿Quieres saber los resultados? Son estos de aquÃ. Estos de aquà son los resultados
de los anuncios que he recibido esta semana. Y como puede ver, se tratan de anuncios muy
variados y que no coincidan con los... ¿Pero qué cojones?
SÃ, esto ocurrió. Uno de los productos que mencioné sà apareció en un anuncio a las
horas de haberlo mencionado en una conversación. Y no solo el producto, sino incluso la misma
marca que mencioné, Lenovo. ¿Significa esto que la teorÃa se confirma?
Pues no realmente, aquà lo único que se puede confirmar es lo idiota que fui yo al
seleccionar este producto, porque, oh sorpresa, un informático, una persona de mi perfil
apasionada de la tecnologÃa, no es extraño que se le anuncie un portátil. ¿Y la marca,
Lenovo? Bueno, es la misma marca del portátil que yo tenÃa antes de tener este de aquÃ.
Es decir, al final me están ofreciendo un producto del cual Google tiene que saber que
efectivamente me interesa. Pero igualmente, vale, lo damos por bueno,
tanto para Google. ¿Significa esto algo? De los tres productos solo nos ha anunciado uno.
Eso significa que, bueno, todavÃa quedan dos productos para los cuales Google no ha
activado su extraño mecanismo. Y no solo eso. Para dar este experimento por bueno,
no solo seleccioné tres productos que usarÃa para hablar delante del móvil, sino que también
elegà otros tres productos que en ningún momento mencioné delante del dispositivo
y que me servirÃan como grupo de control en este experimento. Y fÃjate que en este
caso también tenemos anuncios de esta lista que sà han salido como publicidad, como por
ejemplo el coche. Aunque esto es ningún caso significativo de nada por el poco volumen
de datos que estamos tratando en este experimento, lo que empezamos a observar es la tendencia
natural de lo que ocurrirÃa si la hipótesis que estamos barajando, es decir, que Google
nos espÃa, fuera errónea. Es decir, que si se te pasara un producto por la cabeza, pues
la probabilidad de que aparezca un anuncio de ese producto deberÃa de ser la misma tanto
si lo hablas al dispositivo móvil como si no. Además, si nos fijamos, podemos ver que
la variedad de anuncios que Google me muestra es tan amplia en el tipo de producto que en
muchos casos me sorprende ver que el perfil de cliente que tiene creado para mà sea tan
malo. Sobre todo teniendo en cuenta la cantidad de información mÃa que deben de tener. En
serio, perfumes, tiendas de ropas, condones, o incluso muebles cultivados. Tanto el análisis
técnico que hemos hecho antes como el experimento que acabo de mostrar ahora parece que no apoyan
la idea de que Google nos espÃe. Al menos no de la manera a la que nosotros creemos.
Y sin embargo, parece que hay mucha gente dispuesta a creer en esta idea. ¿Por qué?
Hace una semana realizó una encuesta en Twitter en la que participaron más de mil personas
en la que el 60% de ellas aseguraron que sà creÃan que Google te escuchaba a través
del móvil. Creo que uno de los motivos por los que este mito está tan extendido es porque
se ha mezclado con casos reales que sà son conocidos donde se realizaban escuchas no
autorizadas a través de los dispositivos móviles. Casos que tenÃan como protagonistas
a organizaciones gubernamentales o aplicaciones de terceros que simplemente abusaban de los
privilegios conseguidos por los usuarios. Esto además se combina con que nosotros como
personas somos máquina de encontrar patrones, incluso en aquellos casos donde no los hay.
Todo se conoce como pareidolia y el caso más común es el de encontrar patrones visuales
que nos recuerden a caras incluso cuando realmente no lo son. En este caso queremos ver un patrón,
una relación causal, entretener una conversación y recibir un anuncio. El problema es que para
establecer esa relación causal dejamos de lado todos aquellos casos, aquellas conversaciones,
para las que nunca recibimos ninguna publicidad. Un error en el razonamiento lógico conocido
como el sesgo del superviviente. Además, ¿cómo estás tan seguro que la relación
causal es que esa conversación ha generado ese anuncio? A lo mejor la relación causal
es al revés. A lo mejor durante la pasada semana tuviste ese anuncio de forma repetida
porque ese producto estaba en campaña y eso ha desembocado en que tú hables de ese producto
en esta conversación, lo cual no serÃa extraño que después de esta conversación volvieras
a ver ese mismo anuncio. O a lo mejor el uso que le hayas podido dar a determinados productos
de Google, como su buscador o YouTube, le haya dado las pistas suficientes para saber
cuál es el interés tuyo por un determinado producto. Interés que va a acabar desembocando
posiblemente en un anuncio de publicidad tanto si tú has tenido esa conversación como si
no lo has tenido. Como ves las causas pueden ser múltiples y seguramente muchos de ustedes
todo esto ya lo sabÃan y otros muchos seguramente les habré convencido durante este video.
Seguramente habrá algunos que todavÃa sigan apegados a la idea original de que Google
te espÃa y que tenga argumentos para rebatir todos los argumentos que he mostrado en este
video. Si tus argumentos no se parecen a ninguno de los que están apareciendo ahora en pantalla
pues te invito a dejarlo abajo en comentarios para iniciar un debate que pueda ser interesante
y sobre todo sano. Si te ha gustado este análisis recuerda compartirlo en redes sociales con
todos tus contactos a ver si con suerte estas navidades no tienes que discutir de este tema
con tu cuñado y si te ha gustado este vÃdeo por el canal pues te recomiendo suscribirte
para todo lo que pueda venir y también darle a like a ver si entre todos llegamos al trillón
de likes en menos de un siglo. Bueno, algo asÃ. En cualquier caso nos vemos con más
inteligencia artificial en el próximo vÃdeo.