This graph shows how many times the word ______ has been mentioned throughout the history of the program.
El cerebro. El cerebro es una máquina tan potente como compleja. Siendo uno de los grandes
retos de la humanidad, el llegar a descubrir cómo funciona. Poder responder preguntas
fundamentales como de dónde emerge la inteligencia y la conciencia. ¿Qué afecta a su funcionamiento?
Tal vez el ecosistema de bacterias que conviven en nuestro cuerpo o tal vez procesos cuánticos
que todavía no hemos llegado a entender. Siento decirte que mis conocimientos en biología
son limitados y que no puedo darte respuesta a ninguna de estas preguntas. Sin embargo,
lo que sí te puedo decir es que aún cuando muchos de sus mecanismos todavía suponen
un gran misterio para los neurocientíficos, en otros campos de estudios como el de la
inteligencia artificial, el cerebro es una fuente de inspiración sobre la cual se han
desarrollado muchos de los conceptos más importantes. Uno de estos conceptos es el
de los paradigmas de aprendizaje. Los mecanismos que permiten que podamos procesar toda aquella
información nueva que percibimos para acabar transformándola en conocimiento. Como podrás
imaginar, saber cómo funcionan estos mecanismos es algo fundamental dentro del campo del Machine
Learning y esto es así hasta tal punto que todos los algoritmos y técnicas dentro de
este campo pueden ser clasificados en tres grandes grupos según cual sea el paradigma
de aprendizaje que estén aplicando. Estos tres grupos son Aprendizaje Supervisado, Aprendizaje
No Supervisado y Aprendizaje Reforzado. En el vídeo de hoy nos entraremos a aprender
los dos primeros paradigmas, que habitualmente son los más utilizados. Si consigo que entiendas
estos dos conceptos serás capaz de clasificar el 90% de los algoritmos del campo del Machine
Learning. ¿Estás preparado? ¡Comenzamos! Cuando hablamos de Aprendizaje Supervisado
nos estamos refiriendo a un tipo de aprendizaje que se basa en descubrir la relación existente
entre una variable de entrada y una variable de salida. O lo que es lo mismo, el aprendizaje
surge de enseñarle a estos algoritmos cuál es el resultado que quieres obtener para un
determinado valor. Tras mostrarle muchos ejemplos, si se dan las condiciones, el algoritmo será
capaz de dar un resultado correcto incluso cuando le muestre valores que no haya visto
antes. Para que entiendas mejor esto, intenta adivinar
lo siguiente. Imagínate que te digo que para un valor cualquiera, por ejemplo el 1, obtengo
como resultado el número 2. Para el número 2 obtengo el número 4. Para el número 6
obtengo el número 12. Para el número 9 el número 18. Si ahora te pregunto qué resultado
voy a obtener para el número 10, tú que me respondes.
Efectivamente el resultado es 20. ¿Verdad? Sí.
Fíjate que curioso, mira, entre la variable de entrada y la variable de salida tú has
sido capaz mediante observación de encontrar que la relación existente es la de multiplicar
la entrada por 2. Esto significa que si yo ahora te diera un nuevo valor, un valor que
no haya visto previamente, por ejemplo el 15, tú serías capaz aplicando la regla que
has aprendido de obtener un resultado, 30. Esto significa que mediante observación tú
has sido capaz de generalizar tu conocimiento. Y esto, señoras y señores, es la clave del
aprendizaje supervisado. Si esta es la primera vez que te enfrentas
a este concepto, quizás estés pensando, bueno, pues no es para tanto. No es que sea
muy complicado averiguar que un número es el doble del otro.
¡Qué decepción! Me voy. Dislike y me desuscribo. Espera, espera, no te vayas todavía. ¿Quieres
algo más impresionante? Vale. ¿Y si te digo ahora que encuentres cuál es la relación
entre un correo electrónico y su clasificación, como spam o correo deseado?
Seguramente tú serías capaz de leerlo y poder clasificarlo sin problema, pero ¿serías
capaz de explicar por qué? ¿Qué patrones hacen que un correo sea o no sea spam? Dale
un algoritmo de aprendizaje supervisado, muchos ejemplos de correo, y cuál es su clasificación
y ten por seguro de que aprenderá cuáles son aquellas características que hacen que
un correo sea o no sea spam. ¿Cómo? ¿Que todavía no te impresiona lo
suficiente? ¿Y si te dijera ahora que intentarás aprender a detectar si una persona va a sufrir
o no de depresión a partir de su cuenta de Instagram?
Es decir, si te enseñara mil et ejemplos de galerías de usuarios y te dijeran si sufriron
o no de depresión, ¿sabrías encontrar qué elementos son los que te permitirían descubrir
esto? Sinceramente, si alguien me propusiera esta
tarea diría que es imposible, que no se puede diagnosticar si alguien sufrirá de depresión
a partir de su cuenta de Instagram. Sin embargo, con estos mismos datos, un algoritmo
de aprendizaje supervisado en 2016 pudo aprender a diagnosticar esta enfermedad con una eficacia
mayor que la de los doctores. Todos estos ejemplos que te estoy mostrando
son reales, y solamente es una pequeña muestra de lo que se puede conseguir con esto. Y es
que lo impresionante de esta técnica es que funciona. Muéstrale a uno de estos algoritmos
suficiente datos de entrada y de salida, y si existe una relación, será capaz de aprenderla.
Por esto mismo, el aprendizaje supervisado ha sido el paradigma que más aplicación
práctica ha tenido durante las últimas décadas, liderando la nueva corriente al alza que ha
vivido la inteligencia artificial. Por cierto, lo de denominarle supervisado viene
del hecho de que al mostrarle los resultados que queremos al algoritmo, estamos participando
en la supervisión de su aprendizaje. Quizás, llegados a este punto ya te estés
preguntando, si esto es el aprendizaje supervisado, entonces ¿qué es el aprendizaje no supervisado?
Por definición, el aprendizaje no supervisado es el paradigma que consigue producir conocimiento
únicamente de los datos que se proporcionan como entrada, sin necesidad en ningún momento
de explicarle al sistema qué resultado queremos obtener.
Quizás esta definición sea un poco abstracta, y de primeras, te cuesta entender cómo se
puede aprender sin recibir ninguna pauta previa, pero ya verás que con el siguiente ejemplo
empiezas a encajar las piezas. Imagínate que te adentras en un mundo desconocido,
un lugar que no conoces y del cual no tienes ninguna información previa. Encuentras un
papel escrito con símbolos que parecen representar un idioma que no conoces, pero sin embargo,
te das cuenta de algo. Parece que en ese papel puede haber escrito más de un idioma diferente.
Tú no entiendes ninguno de ellos, pero sin embargo intentas reconocer qué símbolos pertenecen
a qué lenguaje. ¿Serías capaz de averiguarlo? Este problema que acabas de resolver se llama
clasterización, y es un tipo de problema muy importante dentro del campo del aprendizaje
no supervisado. Como ves, sin necesidad de que nadie supervise tu respuesta, has podido
generar un tipo de conocimiento de valor con los símbolos que te he dado como entrada.
La dificultad de los algoritmos no supervisados es que no tienes ningún ejemplo de respuesta
con el que saber si el algoritmo está actuando correctamente. De hecho, en el problema que
te he dado, también existe la duda de saber cuántos lenguajes existen. ¿Te das cuenta,
tío? Por el contrario, una primera ventaja que se puede deducir de este tipo de aprendizaje
es que los conjuntos de datos para entrenar son menos costosos de conseguir. Piénsalo,
en el caso de aprendizaje supervisado, si quisieras entrenar a un algoritmo para clasificar
perros y gatos, necesitas no solo las imágenes de entrada, sino también que alguien, típicamente
un humano, vaya visualizando imagen por imagen y etiquetándola como perro o gato. Y ¿sabes
qué? Estas bases de datos como mínimo suelen superar los 100.000 ejemplos, así que te
podrás imaginar que no es una tarea fácil o barata de hacer. Como ves, el aprendizaje
no supervisado tiene su valor. Pero créeme cuando te digo que esconde mucho más de lo
que parece. De hecho, la comunidad científica en torno al campo del machine learning reconoce
en que el futuro del campo pasa por este paradigma. Lo que hace el aprendizaje no supervisado
es buscar patrones de similitud de los datos de entrada, por ejemplo, los símbolos de
un lenguaje. Lo interesante es que los algoritmos más potentes de este tipo son capaces de
descubrir a la perfección cuál es la estructura interna que han generado dichotatos. Piensa
en una silla. ¿Cómo la definirías? ¿Así? ¿Así? ¿Así o así? Todo el mundo comprende
el concepto de silla, pero sin embargo, cuando nos fijamos en la realidad nos encontramos
con que este concepto tiene muchas variantes diferentes.
Entonces, ¿qué es realmente una silla? Es muy interesante esto, porque es algo que nuestro
cerebro consigue hacer de forma automática, y algo que el aprendizaje no supervisado está
aprendiendo a hacer. Actualmente los algoritmos ya son capaces de aprender estas estructuras
conceptuales, que son denominadas espacios latentes. Una vez construyes este espacio,
las máquinas consiguen capacidades tan interesantes como las de saber si una cosa es similar a
otra cosa. Por ejemplo, el significado de dos palabras. O incluso, puedes operar matemáticamente
con conceptos. Por ejemplo, si entrenas de forma no supervisada una inteligencia artificial
para reconocer caras, puedes coger un punto en este espacio construido que representa
un hombre con gafas, otro punto que representa un hombre sin gafas y restarlos, y el resultado
sumarlo a un tercer punto que representa una mujer sin gafas. Es impresionante ver que
el resultado de esta operación es otro punto cuya representación es el de una mujer con
gafas. Las implicaciones de esto son absurdamente brillantes, y por ello quiero repetir de nuevo
lo que dije previamente. El aprendizaje no supervisado señala un camino muy prometedor
en el futuro de la inteligencia artificial. Una cosa que quiero que te des cuenta es que
en este vídeo no nos hemos parado en ningún momento a explicar cómo se produce este aprendizaje.
Y no hace falta. Para entender los paradigmas de aprendizaje, lo único que necesitas saber
es cómo interactúa el sistema de inteligencia artificial con la información de entrada
y con la información de salida. Nada más. Esta forma de entender a un sistema se conoce
como caja negra. Es decir, para nosotros el agente inteligente es una caja de la cual
no nos interesa saber lo que ocurre en su interior. Únicamente nos interesa la interacción
de este sistema con su entorno, es decir, saber el que hace y no el cómo lo hace. De
momento lo dejaremos por aquí, pero ten claro que hablaremos mucho más de esto en este
canal.
Ahora, si lo que quieres es abrir la caja y ver qué contiene, lo que vas a encontrarte
será un mundo de algoritmos, matemáticas y estadísticas. Tranquilo, abriremos esta
caja, pero eso será en otro vídeo.
Subtítulos por la comunidad de Amara.org