This graph shows how many times the word ______ has been mentioned throughout the history of the program.
Déjame que te cuente una historia.
En el año 2000X, la humanidad consiguió desarrollar la Inteligencia Artificial lo
suficientemente como para iniciar una transición industrial del país más avanzado de la Tierra.
La tarea especificada a la IA como proyecto piloto era muy básica, fabricar tornillos.
Una tarea que la Inteligencia Artificial fue capaz de resolver con creces desarrollando
tornillos a unos niveles de producción antes nunca vistos.
El sistema parecía funcionar a la perfección consiguiendo desarrollar su única tarea especificada
de manera óptima.
El problema?
Que nunca se pensó los niveles de optimización que esta llegaría a alcanzar.
Y es que cuando el acero de la fábrica se agotó, la IA concluyó que para hacer más
tornillo debía de expandirse y salir a buscar más.
Un problema más complejo que fue resuelto por ella con una adaptación más compleja,
la autoreplicación.
Fue en ese momento en el que se perdió el control del sistema o los sistemas.
Poco a poco la IA fue minando cada vez más recursos para así poder desarrollar la economía
de su plan de expansión.
Y fue en el momento en el que los recursos de la Tierra se agotaron, cuando dieron el
paso hacia el cosmos, propagándose y autoreplicándose planeta a planeta, minando asteroides, lunas
y en realidad sistemas solares enteros, consumiendo todos los recursos a su paso con un único
fin.
Para ejecutar aquella tarea que se la había especificado, seguir fabricando tornillos.
¿La inteligencia artificial que hacía trampas?
No, no exactamente.
Seguro que recordarás que hace dos semanas te hablé de una arquitectura de inteligencia
artificial capaz de hacer transformaciones increíbles en imágenes.
El sistema llamado CycleGun planteaba una estructura cíclica por la cual una red generativa
adversaria aprendía a traducir una imagen de un estilo a otro y otra red generativa
adversaria aprendía a hacer la transformación contraria con el fin de preservar el contenido
de la imagen original, ¿te acuerdas?
Vimos como este sistema era capaz de hacer transformaciones de estilo de manera impresionante
como esta de aquí, donde podemos transformar una imagen satelital al estilo de Google Maps
y nuevamente transformar la imagen a su estilo original.
Pero… hay algo que falla, ¿te has dado cuenta?
Venga, te dejo unos tres segundos para que puedas pensar cuál es la respuesta a tiempo.
Como se ve, parece que la inteligencia artificial logra ser la tarea que le hemos definido correctamente,
pero de manera muy correcta, de hecho.
Porque la cosa es, ¿cómo es posible que la red neuronal sepa a partir de esta imagen
que por ejemplo esta zona de aquí que aparentemente es una textura plana corresponde con un área
arbolada en forma circular, o que puede inferir parte del detalle y color del techo original
de esta nave de aquí solamente a partir de esta superficie plana?
Parece que la red neuronal de alguna manera tiene la asombrosa capacidad de saber cuál
es la información original que debe de recuperar, algo que ciertamente esconde un truco.
¿Cómo lo hace?
La esteganografía es el nombre dado al arte de esconder mensajes o objetos de manera que
su existencia no pueda ser percibida, de esconder mensajes ante el ojo humano.
Esto a lo largo de la historia se ha utilizado en la pintura, o en la escritura, o también
lo utilizó Tesla para esconder un mensaje para aquellos usuarios que intentarán ver
antes de tiempo el diseño de su nuevo coche.
Y la esteganografía es también la habilidad aprendida por esta red neuronal y demostrada
en la siguiente publicación.
Una publicación donde se comprobaba que efectivamente la asombrosa capacidad de la Cycle Gun se
ocultaba tras algo que podía ser observado solamente cuando se amplificaba la información
de la imagen.
Un patrón.
Un patrón secreto que la red ocultaba bajo ligeras perturbaciones en las intensidades
de los pixeles de la imagen generada.
Unas perturbaciones que codificaban texturas, colores, pistas, información de la imagen
original.
Oculto bajo un patrón imperceptible al ojo humano y que serviría como canal de comunicación
para que la segunda red generativa supiera cómo recuperar la información original.
Algo así como una chuleta que se pasaban de una red a otra para poder así hacer bien
su tarea.
Realmente si eres fan del canal, esto de perturbar los pixeles de una imagen para codificar información
debería de sonarte de cuando vimos que era un ataque adversario.
Aquella forma por la que podíamos trucar de manera imperceptible los pixeles de una
imagen para así poder confundir a una red neuronal a la hora de detectar objetos.
Tienes una explicación completa aquí y un tutorial de cómo hacerlo acá.
El problema aquí es que al igual que ocurría cuando hablábamos de hackear redes neuronales
con ataques adversarios, este método hace que el aprendizaje de la red sea muy poco
robusto y que una ligera perturbación en la imagen, como perder calidad al ser comprimida
en.jpg, haga que su metódico y detallado patrón de información codificada, su chuleta,
quede fácilmente inservible, es decir, que la información de la imagen original no
sea recuperable y que su conocimiento por tanto sea inútil.
¿Una inteligencia artificial que hace trampas?
No, no exactamente, y es que en realidad no deberíamos de culpar a la red por optar
por esta estrategia, ya que al final es una opción inteligente para resolver el problema
bastante puñetero que nosotros le hemos pedido que haga, porque cuando pasas de un estilo
de imagen como este a este otro de aquí, el proceso es comparable al de estar comprimiendo
información, información que será perdida a menos que de alguna forma la red aprenda
a preservarla para así poder cumplir su tarea.
No, no se trata de una inteligencia artificial que hace trampas, se trata de una inteligencia
artificial que ha aprendido a resolver a toda costa la tarea que le hemos especificado.
Aprender a hacer tornillos.