This graph shows how many times the word ______ has been mentioned throughout the history of the program.
Cuando hace unas semanas expliqué de qué va todo esto del blockchain en este vídeo de aquí,
no solo os expliqué cuáles son las bases técnicas a nivel de criptografía,
matemáticas o ciencias de la computación, no, también hablamos de cuáles son algunas de las
materializaciones prácticas que esta tecnología tiene, pues por ejemplo a la hora de hablar de
economías descentralizadas con el bitcoin, o en la ejecución descentralizada de aplicaciones que
residen dentro de la cadena de bloques, lo que serían los smart contracts, o incluso el boom
reciente que existe en el uso de esta tecnología para la certificación e intercambio de propiedad
de objetos como por ejemplo objetos artísticos, en lo que se conocen como NFTs, ejemplos de
sectores que se están desarrollando sobre esta idea de la cadena de bloques. Un artífice informático
que permite la creación de redes descentralizadas, auto organizadas, donde no existe un poder central
que pueda tomar decisiones unilaterales y donde el control, la gestión y el propio funcionamiento de
la red depende de los usuarios que forman parte de ella. Una idea muy potente que en el medio y
largo plazo podría cambiar las reglas del juego de muchísimas industrias y de la cual hoy quiero
seguir profundizando, pero profundizando a nivel aprendizaje profundo, deep learning, la inteligencia
artificial, ya que claro, a ver, dada la temática de este canal pues queda una incógnita por resolver
y es, vale, todo esto del blockchain suena muy bien, pero ¿cómo se combina todo esto con la
inteligencia artificial? ¿Tiene sentido hablar de inteligencia artificial descentralizada? ¿Qué
ventajas y inconvenientes tiene este cóctel de palabras cargadas de hype? ¿Pasa por el blockchain
un futuro donde el gobierno de los datos recaiga en los usuarios? En el vídeo de hoy quiero daros
una visión más clara y completa de todo este panorama tecnológico que tenemos delante. Y ya
digo yo que esto no va a ser fácil ya que el ambiente está muy cargado de humo, pero sea como
sea, el viaje ya se ha iniciado, así que poneros cómodos porque comenzamos. Si recuerdas, cuando
hablamos del blockchain, de lo que estamos hablando realmente de una estructura de datos,
equiparable a lo que sería la base de datos que usa una empresa como Facebook para guardar toda
la información de sus usuarios, o el cuaderno que usa la tienda de la esquina para llevarlos
a puntes con tablet de cuánto gasta y cuánto ingresa. Es decir, el blockchain es otro soporte
de información que podemos utilizar para agregar y almacenar datos. Y es que a diferencia de una
base de datos centralizada de una empresa o un cuaderno de apuntes, esta es una estructura de
datos que está diseñada para garantizar una serie de propiedades que la vuelven muy, pero
que muy interesante. Ojo, aquí no digo garantizar al estilo una empresa X que te dice te garantizamos
que tus datos van a estar seguros en nuestra base de datos. No, no va por ahí, no es ese tipo de
garantías. No hablamos de una garantía en la que tú debas de confiar, sino de una garantía que viene
dada matemáticamente por el propio diseño del sistema. ¿Qué propiedades son estas? Pues los
datos registrados en una blockchain son inmutables. Es decir, no hay una forma práctica de que un
dato que haya sido registrado en una cadena de bloques en el tiempo pueda ser modificada por
ningún otro usuario. Lo que se registra en la blockchain se queda en la blockchain. Además,
la información registrada en esta cadena de bloques es pública. Cualquier usuario puede
fiscalizar la sucesión de transacciones que se han ido realizando en el tiempo. Ojo, que sea
pública no significa que no pueda ofrecer confidencialidad. Mirad por ejemplo como en
la cadena de bitcoin, pues aún siendo todas las transacciones públicas, ofrece herramientas de
criptografía para poder ocultar la identidad de quienes participan en dichas transacciones. Tú
nunca sabes qué persona está enviando dinero a quién. Y esto conecta con otra propiedad más,
y es que esta base de datos es segura, está validada. Diseñada para que de nuevo matemáticamente
podamos tener la certeza de que la información que se va agregando está validada y que por
tanto va a contribuir para que cual sea el uso que tenga esa blockchain, pues no se ve afectado
por usuarios que se quieran aprovechar de esta. Por ejemplo, en la cadena de blockchain de la
red bitcoin, una comprobación podría ser que cuando un usuario gaste 5 bitcoins, se compruebe
que efectivamente dicho usuario cuenta con esos fondos. La propia red de bitcoin valida que esa
transacción sea correcta. ¿Lo ves? Y si eres nuevo en esto del blockchain, pues seguramente estés
pensando que todo esto está muy bien. Seguridad, inmutabilidad, validez de la cadena. Seguramente
hay mucha gente detrás de esto trabajando, una entidad, algún tipo de organización,
para que estas cadenas de bloques funcionen correctamente, gestionando la base de datos.
¿No? Pues no. No existe una entidad centralizada que coordine todo esto. Y es que el valor de la
tecnología blockchain realmente es este, que es descentralizada. No existe una base de datos en
una oficina de una empresa X que se encargue de gestionar que todo funcione bien, sino que en
este caso la base de datos está distribuida entre los ordenadores de los participantes de la red.
Son los usuarios de esta red los que van a hacer que el sistema funcione correctamente,
que las transacciones sean válidas y que todo funcione como debería de funcionar. Además,
con interesantes sistemas de incentivos en función del protocolo que se implemente,
donde por su participación podrán ir acumulando valor dentro de esa red. Esto de que dentro de la
red de bitcoins, pues tú puedes ganar bitcoins a través del minado o de las comisiones, es
exactamente esto. Un mecanismo, un incentivo para que la red se autogestione a sí misma. Y esto es
muy potente. Para que entendáis mejor el potencial de esto, pensad en este ejemplo típico. Uber,
una empresa cuyo valor reside en conectar a usuarios con conductores. Ellos tienen la base
de datos de usuarios, de vehículos y ellos gestionan que ambas partes se encuentren. Y bueno,
a lo mejor algún día deciden que todo el mundo puede utilizar sus servicios, menos aquellas
personas que lleven una camiseta marrón. Bueno, ellos pueden, ellos mandan, es su servicio. Pero,
¿y si quitamos a Uber de la ecuación? Podríamos por ejemplo distribuir en una cadena de bloques
la información de los conductores y los usuarios que se dirán de alta. Y ahora gestionar detalle
entre todos que la transacción de que un cliente encuentra el conductor idóneo pues se produzca. Y
de ocurrir, la propia transacción de valor también se podría gestionar automáticamente desde la misma
red. Conductor y clientes contentos, sin necesidad de ninguna empresa mediadora. Esta idea suena guay,
al menos en teoría. Y si esta idea te atrae, creo que es hora de entrar en materia para no hablar
solamente de la descentralización de un servicio como Uber, sino de la descentralización de nuestros
modelos de Machine Learning. Hablemos de la Inteligencia Artificial descentralizada. En este
canal hemos hablado mucho de Inteligencia Artificial y es por eso que hoy quiero haceros
notar algunos de los problemillas o limitaciones que este mundillo puede tener. Mira, imaginad
que los laboratorios DOTCSV después de años de investigación e ingentes cantidad de dinero dadas
por nuestros inversores, por fin saca a la luz un potentísimo modelo del lenguaje capaz de generar
texto realista como nunca antes hemos visto. Este modelo se llama el Gran Pangolin Parlante GPP3,
un modelo entrenado por mi equipo a través de un dataset que nosotros hemos creado y que me
pertenece a mí y que vosotros podéis utilizar a través de una API de pago que, bueno, pues yo iré
dando permiso a la gente que quiera. Como veis, una situación hipotética alejada de la realidad,
donde yo tengo centralizado y soy propietario de este modelo de Inteligencia Artificial,
imponiendo mis reglas y teniendo siempre el control unilateral de su uso. Yo podría redactar
una política de término de uso donde decir que si quieres hacer demos en directo de esta tecnología
pues me tienes que pedir permiso o si quieres desarrollar alguna aplicación a través de mi
API pues tienes que tener mi autorización. Y a fin de cuentas cuando este proyecto ya no me
sea rentable puedo apagarlo y ya está. GPP3 es mío, pero ¿y si no lo fuera? Imaginad ahora un mundo
donde GPP3 no fuera entrenado por una empresa propietaria, sino por toda una comunidad que,
participando de manera colaborativa, hemos conformado enormes datasets que van a quedar
públicamente registrados en una cadena de bloques y donde colaborativamente todos vamos a poder ir
entrenando al modelo con incentivos financieros según cuánto sea la computación que se damos,
incentivos que premien a aquellos usuarios que por su actividad vayan mejorando el entrenamiento
del modelo. Y un modelo que finalmente quedará disponible para uso y disfrute de todos, donde
con una pequeña transacción pues simplemente para costear los costes computacionales ya nos
permita obtener resultados. ¿Cómo suena esto? Como idea suena muy bien y creo que lo vamos a
entender mejor si vemos un ejemplo real de todo esto funcionando. Y para ello quiero presentar
esta demo de un proyecto piloto lanzado por Microsoft en 2019, donde muestran un caso
de entrenamiento de un modelo de Machine Learning a través de una red descentralizada de blockchain.
El modelo entrenar es una versión sencilla de una red neuronal, un perceptron, que lo que aprenderá
será clasificar el típico dataset de review de películas con sentimiento positivo si la review
es favorable o negativo si no lo es. En este caso el modelo con todos sus parámetros residirá dentro
de la cadena de bloques y cualquier usuario podría acceder a esta para hacer uso del modelo. El
usuario podrá acceder al último estado de entrenamiento del modelo y ejecutar predicciones
localmente en su ordenador para ver si sus reviews son positivas o negativas. Esto es similar a cuando
tú entras a GitHub y te descargas algún modelo pre-entrenado que luego ejecutas localmente,
con la diferencia de que en este caso el modelo no reside en un servidor central de GitHub. En
este caso el modelo reside en una blockchain que está distribuida entre todos los ordenadores de
los usuarios de esta red. Aparte de esto lo interesante viene ahora, cuando se produce el
entrenamiento. Porque a lo mejor tú tienes la tarde libre y altruistamente quieres colaborar
a mejorar este modelo entrenándolo con nuevos datos etiquetados. Te sientas ante tu ordenador
y escribes la película me ha parecido horrible y lo etiquetas como negativo o qué película tan
buena y lo etiquetas como positivo. Y con estos datos el modelo se podrá continuar entrenando y
por un lado estaremos pues mejorando el rendimiento de este modelo y por el otro también estaremos
configurando un nuevo dataset de reviews de películas. Todo de manera colaborativa. Esto
está guay y esta forma de generar datasets de manera colaborativa existe más allá de la blockchain
con herramientas como Amazon Mechanical Turk, donde tú puedes pagar a un grupo de personas para que
hagan ellos el etiquetado manual de tus datos y así tú puedas entrenar a tus días. Pero claro,
y qué pasa si de repente hay alguien que lo hace mal. Entre tanta gente colaborando es normal que
haya personas que se equivoquen e incluso algunas que maliciosamente pues sabiendo que tú estás
premiando el número de respuestas que se registran pues quieran responder rápidamente sin preocuparse
si lo están haciendo bien o mal. ¿Cómo evitamos esto? De forma tradicional esto exigiría a los
responsables del dataset pues a establecer mecanismos de control de verificación de
puración del dataset. Pero ¿no podría la tecnología blockchain aportar no ventajas como
estas? Pues sí. En esta demo en concreto el sistema que plantean es el siguiente. Cada vez
que tú quieras entrenar al modelo con tus datos esto te obligará a ceder parte de tus fondos. Ojo,
no estás pagando. Simplemente bloqueas temporalmente estos fondos que te serán devueltos si te has
portado bien. A esto en inglés se le denomina stake y es una dinámica muy típica dentro de
estos sistemas de blockchain. Ahora, ¿cómo recuperamos el dinero? Pues la idea es que si
pasado un tiempo donde el modelo ha continuado actualizándose de manera colaborativa este sigue
clasificando tu frase como positiva, tal y como tú dijiste, tú podrás solicitar un reembolso de los
fondos que tenías bloqueados con estos datos. Como el entrenamiento colaborativo del modelo ha dado
por bueno el etiquetado que tú has hecho de los datos, tu buen comportamiento será premiado con
la recuperación de los fondos. ¿Lo ves? Por el contrario, imaginad que no, que yo soy un usuario
malicioso o que por error he introducido una etiqueta errónea. Por ejemplo, la review una
película horrible la etiqueto con sentimiento positivo. Evidentemente esto es erróneo y si
entra ahora el modelo pues podría estar llevando mi clasificador a un estado peor donde ahora este
tipo de reviews fueran etiquetadas incorrectamente. Pero esto no es un problema ya que si asumimos que
la mayoría de usuarios de esta red motivados por el sistema de incentivos siguen contribuyendo a la
mejora del clasificador, lo que vamos a ver es que en el tiempo según sigan agregando datos de
entrenamiento, el sistema pues irá cambiando su estado hacia un punto en el que la review esta
película horrible se etiquete como sentimiento negativo. Es decir, poco a poco el resto de
usuarios le estarán quitando la razón al usuario malicioso. Y aquí ahora este usuario tiene un
problema porque como la respuesta que él ha introducido ya no coincide con lo que el modelo
colaborativamente ha aprendido a predecir, los fondos que él había bloqueado no podrán ser
recuperados. Equivocarse le ha supuesto un coste y ese dinero ahora no le será devuelto. De hecho,
ese dinero ahora podrá ser reclamado por aquellos participantes de la red que en el pasado se hayan
contribuido con etiquetas correctas a la mejora del modelo a modo de recompensa para incentivar
así que todos los usuarios actúen correctamente. Si esta dinámica se repite en el tiempo, los fondos
de los actores buenos se irán aumentando, lo de los actores maliciosos irán disminuyendo y la tasa
de acierto de nuestro modelo seguirá incrementando. Un modelo que será accesible por todos y que
reside junto a su dataset dentro de una cadena de bloques. Esto parece un buen proyecto piloto de
lo que podría ser el futuro de la inteligencia artificial descentralizada, pero no vamos a dejar
pasar que este modelo tiene algunas limitaciones. La más evidente es que los modelos de inteligencia
artificial realmente no son tan sencillos como nos muestran en esta demo. Lo que vemos aquí es
una red neuronal de una sola capa que analiza 100 características dadas como input y esto
requiere únicamente 100 parámetros que almacenar dentro de la blockchain. Toda la inteligencia
artificial aquí son sólo estos 100 numeritos, pero claro volviendo a los ejemplos de los enormes
modelos de lenguaje con los que contamos hoy en día, esta cifra pasaría de los 100 numeritos a
los cientos de miles de millones de parámetros, significando esto que tendríamos que incurrir en
elevados costes de almacenamiento dentro de nuestra blockchain y no sólo el almacenamiento del
modelo, también de los datos. En este caso, pues trabajar con texto no exige un almacenamiento en
memoria tan elevado. Una frase tokenizada podría ocupar unos pocos bytes de memoria,
pero esto no sería así si trabajáramos por ejemplo con imágenes o vídeos. Tal y como reconocen los
investigadores en el paper de esta demo, el coste de cargar en una cadena como Ethereum un dataset
tan simple como es el dataset de imágenes Mnist, hubiera tenido en el momento de escribir ellos el
paper un valor de 65 mil dólares. Mal asunto. Esto podría haberse solucionado pasándonos a otras
cadenas donde los costes de transacción fueran más bajos o por ejemplo incluso cambiando las
reglas del juego a través del diseño de un protocolo diferente donde los datos no residan
en la cadena de bloques o como se denomina off-chain. Es decir, si el problema es que el
coste de almacenar el dataset en la cadena de bloques es tan elevado por su tamaño,
una alternativa es almacenarlo fuera de la cadena en algún servicio de almacenamiento típico
aprovechándonos de otras tecnologías modernas descentralizadas y calcular un hash identificador
de dichos datos que serán los que almacenemos en la cadena de bloques. Beneficios? Pues ahora
podemos almacenar grandes volúmenes de datos cuya integridad quedará certificada para siempre en la
cadena de bloques. Ya que si alguien manipula estos datos de aquí, su hash cambiará y nosotros lo
sabremos. Lo malo que los datos ahora están fuera de la cadena, almacenados en un soporte
diferente que podría perderse o ser manipulados. Y sí, a través del hash podríamos saber que esto
ha sucedido, pero igualmente no podríamos evitarlo. Lo único que será preservado para siempre es el
hash de nuestros datos. Como ves, nos movemos en un mundo complejísimo, donde cada decisión que
tomamos dentro del diseño del protocolo nos puede acercar más a esa idea de centralización o
descentralización, mayor integridad o menor integridad, mayor seguridad o menor seguridad.
Todos son decisiones que tenemos que tomar. Y como podrás imaginar, tantas decisiones
pueden pie a que existan numerosos proyectos que buscan esta idea de combinar el blockchain con
la inteligencia artificial y el análisis de datos. Vamos a repasar algunas de las más populares.
Tenemos proyectos como Fetch AI, que traen los principios del mundo de los sistemas multiagentes
del campo de la inteligencia artificial para desplegar servicios, pues como podría ser el
caso que mencionábamos antes de Uber, pero donde parte de la actividad necesaria para que todo
funcione, pues en este caso, encontrar el conductor ideal para tu viaje o alcanzar un precio válido
para ambos, pues puede ser gestionados por agentes inteligentes autónomos en representación de tus
intereses. En este caso, lo que buscan es romper con el típico modelo de aplicaciones centralizado,
tipo cliente servidor, a partir de utilizar una red descentralizada, donde estos agentes inteligentes
puedan participar interactuando unos con otros según las necesidades de cada usuario. Algo
que tengo que decir que desde mi experiencia con sistemas multiagentes me parece complicadísimo.
O por otro lado, tenemos proyectos como Ocean Protocol, que implementan sobre la blockchain
mercados online descentralizados para la monetización e intercambio de datos entre usuarios. Hoy en día
todos nosotros cedemos gratuitamente datos a cambio de servicios a las grandes empresas que
todos conocemos, pero ¿y si quisiéramos sacar valor de estos datos? ¿Cómo podríamos venderlos?
Ocean Protocol lo que permite es que cualquier usuario participe de esta red para comprar o
vender acceso a datasets. Podrías dedicarte a recopilar un dataset de amigos tuyos hablando
un micrófono, transcribir dicho dataset a audio y venderlo a través de este marketplace. En este
caso, la actividad de la red descentralizada se encargará tanto de que el proceso de intercambio
se realice de forma segura entre usuarios como de curar la calidad de los datasets. Y así podríamos
seguir buscando proyectos que combinen IA y blockchain. Creación de redes descentralizadas
de computación que puedan ser alquiladas como servicio, similar a cómo actúa Google Cloud o
Amazon Web Service. Evidentemente también el uso de IA para intentar predecir el precio futuro de
las criptomonedas. O incluso propuestas que buscan sustituir el Proof of Work que tanta computación
consume por modelos alternativos que hagan uso de esta computación, pues por ejemplo para el
entrenamiento de modelos de Machine Learning. En propuestas como la de este paper de aquí,
que introduce el concepto de Proof of Learning. Pole. Y que sospecho que como alternativa pues
también podrá tener sus limitaciones. Ahora, si realmente vamos a hablar de IA descentralizada,
dejadme que me pare en uno de los proyectos más populares dentro de este movimiento,
y que muchos de vosotros me habéis hecho llegar. Singularity Net.
Singularity Net es otro proyecto que propone construir de nuevo un marketplace,
pero donde la inteligencia artificial pueda ser distribuida y ejecutada sin necesidad de que
esta quede descentralizada en las manos de unas pocas empresas. Suena bien. Las inteligencias
artificiales podrán ser ejecutadas por los usuarios e incluso podrán interoperar entre
ellas donde una IA puede llamar a la ejecución de otra. Y donde los usuarios propietarios de
estos modelos podrán recibir dinero por ello. Suena muy muy bien. Y que esto tendrá el potencial
para la construcción de un cerebro global que nos va a acercar a la singularidad tecnológica
de nuestras sociedades y a la verdadera inteligencia artificial general. Vale,
a lo mejor aquí se han flipado bastante. Y es que aquí está la otra cara de la criptomoneda.
Y es que no voy a obviar que en este vídeo nos estamos moviendo por tierras pantanosas,
donde estamos trabajando con dos conceptos muy prematuros, inteligencia artificial y blockchain,
que además esconden detrás de ellos mucho hype. Y creo que el ejemplo de Singularity Net es un
buen punto de comienzo para hablar de esto. Lo reconozco, me ha costado mucho hacer el análisis
de este proyecto obviando que la principal persona que está detrás de él es Ben Gorshel. Una persona
que verdaderamente creo es muy interesante de escuchar. Es la persona que acuñó el término
AGI, Inteligencia Artificial General, pero que con el paso de los años se ha labrado la fama de vender
proyectos envueltos en mucho hype y mezclado con visiones futuristas de la IA, pero que luego está
muy lejos de ofrecer lo prometido. Un ejemplo de ello sería, pues sí, el robot Sofía. Robot que,
como podemos ver, está incluso muy ligado al marketing del proyecto Singularity Net. Recordad
las noticias de hace unos meses del propio robot Sofía creando sus NFTs y vendiéndolos por miles
y miles de dólares. Es ese mundo. Dejando eso de lado, cuando analizo, por ejemplo, el marketplace
de Singularity Net, lo que me encuentro es un proyecto que integra muchísimas tecnologías del
mundo cripto y que realmente atrae el interés de muchísimos inversores que ven interesante esta
mezcla entre blockchain e inteligencia artificial, pero también un marketplace bastante pobre en
contenido con unos pocos modelos que todos podríamos utilizar en otras plataformas y que
realmente me hace cuestionarme hasta qué punto esta herramienta cuenta con el interés de los
verdaderos usuarios que utilizan la IA. Si buscáis en la oferta de internet, encontraréis a dos
tipos muy claros de entusiastas de este proyecto. Por una parte, aquellos inversores que tienen la
expectativa de que la moneda ligada a Singularity Net, la AGI, pues vea su valor multiplicado por
10 o por 100 en los próximos años y realmente pues se interesen por este proyecto solamente por
lucrarse en el largo plazo. Y por otra parte, aquellos tecnos futuristas que realmente ven
en este proyecto una oportunidad para desarrollar una inteligencia artificial general y llegar a la
singularidad tecnológica. Dos grupos que en mi opinión se alejan realmente del valor que creo
que este producto tiene. Ya que de nuevo lo que mi intuición me hace detectar aquí, repito, es mi
opinión, pues es un producto falto de madures y que está mediáticamente sobredimensionado. ¿A qué
me suena esto? Pero quién sabe, el mundo blockchain es incierto y las cosas pueden cambiar a golpe de
tweet. Pero mi sensación es esta, y es que la realidad es que por cada proyecto bueno que me
he encontrado de inteligencia artificial y blockchain, pues también he encontrado otros
tantos proyectos con documentaciones abandonadas, roadmaps incumplidos o con referencias en foros
donde la única preocupación por dicho proyecto es su valor en el mercado de criptodivisas. Este
vídeo no pretende ser un vídeo explicativo de todos los puntos de unión que pueda existir entre
la IA y el blockchain, no es eso. Este vídeo pretende ser una puerta de entrada a este mundo,
un mundo donde dos tecnologías aún prematuras, que tienen muchísimo potencial de combinarse y
de poder traernos cosas muy potentes, a día de hoy todavía se esconden tras una gran barrera de
hype, ruido mediático e intereses económicos. Pero creedme que detrás de todo esto hay muchísima
gente trabajando por la descentralización de la inteligencia artificial y que esto esconde
un gran potencial. No nos quedemos solo con la crítica superficial a todo esto. Si te ha gustado
este vídeo, plantéate formar parte del equipo apoyándolo a través de Patreon. Una pequeña
aportación mensual es suficiente para apoyar todo este tipo de contenido gratis en YouTube.
Aceptamos criptomonedas. Y si te interesa el tema de blockchain, pues recordarte que tienes este
vídeo de aquí, que es una perfecta explicación técnica de todo su funcionamiento a nivel
criptográfico, matemáticas, informática y despeja bastantes dudas de cómo funciona esta
tecnología. Ahora sí chicos, me despido, nos vemos con más Inteligencia Artificial la próxima semana.
¡Adiós!