This graph shows how many times the word ______ has been mentioned throughout the history of the program.
Gracias al desarrollo del campo del aprendizaje reforzado, hemos conseguido desarrollar algoritmos
capaces de ganar a juegos de todo tipo, y cada vez con mayor complejidad. Pero todos
los juegos? No, aún no. En esa lista de futuros retos se encontraba un juego llamado Montezuma's
Revenge, uno de los juegos más complicados del Atari y en el que solo un algoritmo había
sido capaz de superar el primer nivel, y donde nunca nadie antes había superado la puntuación
de 17.500 puntos. Ahora, un nuevo algoritmo desarrollado por Uberlap y denominado Go Explorer
ha conseguido mejorar esto, mejorarlo, por mucho. Superando el segundo, tercer y cuarto
nivel. Y el décimo. Y el número 58. Y de darle la vuelta al marcador con más de un
millón de puntos. Y de dársela una segunda vez con más de dos millones de puntos. Vamos,
sin duda, de dominar completamente este juego. Esta nueva arquitectura desarrollada supone
un nuevo édito en el campo del aprendizaje reforzado y promete allanar el camino en la
resolución de problemas complejos donde la recompensa es escasa y dispersa en el árbol
de búsqueda, algo que tiene su utilidad, por ejemplo, en su uso para resolver problemas
de aprendizaje con robots.
El mes de octubre fue un mes intenso en cuanto a la presentación de nuevos terminales móviles.
Presentación de nuevo hardware sí, pero también de nuevo software. Y es que actualmente,
dada la maduración del mercado móvil, es una tarea complicada introducir innovaciones
y diferenciarse de la competencia a nivel de hardware, más allá de mejoras continuistas
en chips y el diseño del dispositivo. Por tanto, muchas de las características que
buscan enganchar al consumidor final se están produciendo en el apartado del software, teniendo
un gran protagonismo la inteligencia artificial. En algunos casos, el término inteligente
es más una etiqueta dada por el departamento de marketing de turno, pero en otros casos
también hemos visto ejemplos de funcionalidades de machine learning a nivel de usuario muy,
muy interesantes. Vamos a repasar alguna de estas. El dispositivo que más novedades introduce
en este sentido es por supuesto el terminal de Google, el Pixel, que por ejemplo hace uso
de la información capturada por las ligeras perturbaciones que se producen al sujetar el
móvil con la mano, para que cuando saques una foto, dispare una ráfaga de imágenes
que se va a utilizar para capturar la mayor cantidad de información posible y así poder
generar un zoom digital de mayor calidad. Una técnica parecida hace uso el increíble
nuevo modo nocturno que también incluye este dispositivo, y que desde mi punto de vista
rosa casi la magia, que te permite obtener con el móvil tomas nocturnas de gran calidad
incluso en situaciones donde la luz es casi inexistente, utilizando modelos de machine
learning que son capaces de rescatar una gran parte de la información de la escena.
Otra interesante funcionalidad que incluye el Pixel es una primera aproximación al
increíble sistema de Google Duplex que pudimos ver el pasado mes de mayo. En este primer
acercamiento el dispositivo te permite mantener en espera una llamada entrante y dejar que
sea tu asistente el que se encargue de preguntar a la otra persona que qué quiere. En tiempo
real toda la conversación que se produzca será transcrita en texto para que así tú
puedas ver en todo momento lo que está ocurriendo.
Es Huawei otra marca de las que están apostando fuerte últimamente por la inteligencia artificial
en sus dispositivos, y uno de los efectos más llamativos de su Mate P20 es el efecto
Sim City de su cámara, que usa el Machine Learning para resolver un problema de segmentación
que separa en tiempo real el fondo de la persona para dejar la imagen o vídeo en blanco y
negro con la persona destacada en color.
Tenemos también la nueva versión del ARKit que ha llegado a los dispositivos de Apple
en septiembre y que hace uso de un conjunto de técnicas de visión por computador para
ofrecer servicios de realidad aumentada que sean estables y fluidos para sus usuarios.
Todos estos servicios y muchos más son algunos de los servicios de los que podemos disfrutar
desde este mes de septiembre gracias a la irrupción de los algoritmos de Machine Learning
en el mercado móvil.
Uno de los campos donde más beneficio social podemos ganar gracias a la inteligencia artificial
es el campo de la medicina, donde este tipo de técnicas encuentran muchas aplicaciones
diferentes.
En este sentido, en octubre, Google AI presentó un nuevo estudio en el que mostraban cómo
usando una arquitectura de Deep Learning desarrollada en 2017 y denominada Lina, podía identificar
con un 99% de precisión si en una imagen que contenía nódulos linfáticos existía
la presencia de un cáncer metastático.
Este algoritmo no solo es capaz de identificar la presencia del cáncer, sino también de
localizarlo espacialmente en la imagen.
Si recuerdan, esto último ya lo habíamos visto implementado en una sección de noticias
previas con el prototipo del microscopio de realidad aumentada que Google había desarrollado.
Este tipo de modelos, principalmente basados en arquitecturas de redes neuronales convolucionales,
suponen un gran paso a la hora de diagnosticar una gran variedad de enfermedades.
Como demuestra Google en esta publicación, complementar la labor de los doctores junto
a herramientas como Lina puede resultar en una mejora de la eficiencia tanto en precisión
como en tiempo dedicado a resolver esta tarea.
En una línea similar, nos encontramos con una publicación en Radiology del mes de noviembre,
donde nos muestran cómo entrenando con unas 2000 imágenes cerebrales de más de 1000 pacientes,
se pudo entrenar a un modelo de Machine Learning capaz de diagnosticar la enfermedad del Alzheimer
con una antelación media de 6 años antes del momento en el que aparecen los síntomas
tras los cuales se puede hacer un diagnóstico final.
Este estudio, tanto anteriormente visto, aprovecharon la arquitectura Inception V3 como modelos
basados en redes convolucionales para utilizar en estos estudios.
Inteligencia artificial y medicina, muy buena combinación.
¿Eres ese tipo de informático que se regodea en casa viendo cómo la tecnología y la inteligencia
artificial van sustituyendo otros trabajos mientras tú disfrutas programando?
Bueno, pues si eres programador de páginas webs, quizás tengo malas noticias.
Y es que un vídeo de septiembre publicado en Twitter por la empresa TeleportHQ nos muestra
un prototipo basado en visión por ordenador capaz de ir generando el código necesario
para implementar una web cuya estructura sea la diseñada a través de un boceto dibujado
en una pizarra.
Todo esto en tiempo real.
Como se puede ver, según se van dibujando los diferentes elementos de la web, automáticamente
vamos visualizando el prototipo diseñado a partir del código generado.
Un claro ejemplo de cómo utilizando la tecnología basada en Machine Learning podemos eliminar
las barreras técnicas en tareas que hasta ahora eran exclusivas de programadores.
Obviamente esta noticia se basa solamente en un vídeo compartido por la empresa en
Twitter de un prototipo que no sabemos hasta qué punto es funcional.
Pero la tecnología está ahí y es cuestión de tiempo que veamos soluciones que sean capaces
de hacer eso.
Un ejemplo es el de Microsoft que en colaboración con la empresa española CableLab ha implementado
una herramienta disponible online que sirve para este propósito, donde solo subiendo
una imagen de un boceto dibujado a mano puede generarte y descargar el código de HTML equivalente.
Un proyecto muy interesante.
Quizás una de las áreas más interesantes que han surgido durante los últimos años
en el campo del Machine Learning ha sido el de los modelos generativos.
Un avance que estalla en 2014 con la introducción por parte del Gunfather de la Inteligencia
Artificial y Angutt Fellow de las redes generativas adversarias.
Como hemos visto en este canal, desde ese momento el campo de la generación de información
no ha parado, mejorando año tras año los resultados obtenidos previamente.
Primero con caras, luego caras más mejoradas, más objetos y cada vez con mayor calidad
y mayor resolución.
Una tendencia que no para de crecer y que en octubre de este año ha vivido un nuevo
hito.
Navegando por internet, si te encontrarás con estas imágenes de aquí, quizás no te
percatarías de que estas no son reales, que estos animales y estos objetos realmente no
existen, han sido generados por una Inteligencia Artificial.
De hecho tendrías que intentar pedirle la patita a este perro para realmente darte cuenta
de que algo falla.
Y es que estas imágenes han sido generadas haciendo uso de una nueva arquitectura presentada
por un interno de Google, llamada Big Gun.
Esta arquitectura presenta mejoras que hacen que sea capaz de generar imágenes realistas
de alta resolución para dataset complejos en cuanto a la variedad de imágenes.
Como se puede ver, los resultados son absolutamente impresionantes y se establece en la vanguardia
de este tipo de modelos.
Y no solo eso, ha sido tal la repercusión que ha tenido esta arquitectura en la comunidad
investigadora que muchos se han lanzado a jugar, digo investigar y extraer conclusiones
de cómo estas redes generan los resultados que generan, un área aún en descubrimiento.
Esto por supuesto no solo profundiza en el conocimiento de la forma de operar de las
redes generativas adversarias, sino que también nos deja con imágenes generadas muy pero
que muy interesantes.
Ah y por cierto, puedes jugar tu mismo con esta arquitectura en Google Collab, te dejo
el link en la descripción de este video.
Y estas son las noticias que he seleccionado para el video de hoy, como pueden ver son
noticias super interesantes y cada una de ellas pues realmente podrían ser tratadas
en mayor profundidad en videos independientes, y en ese caso es lo que vamos a hacer, voy
a dar la oportunidad a los patreons del canal, a la gente que apoya financieramente este
proyecto para que puedan votar cual de todas las noticias que hemos cubierto en este video,
pues sea tratado en un video independiente con mayor profundidad, metiéndonos más en
la parte técnica de cómo funciona y conocer más detalles de esto.
Así que si quieres saber más de cómo funcionan las vcans y ver más ejemplos de lo que se
ha podido generar, o ver que otros usos tiene el machine learning dentro del mercado móvil,
o también pues quiere ver que usos tiene la inteligencia artificial en medicina y cómo
funcionan estos últimos avances, pues ya sabes que si eres Patreon puedes dirigirte a la
página de Patreon y ahí encontrarás una encuesta donde poder votar.
Por mi parte nada más, estad atentos esta semana porque habrá nuevo video el miércoles,
pero no será en mi canal, sino en el canal de... bueno, ya les contaré, ya avisaré
por detrás, ¿vale?
Muy bien.
Un saludo y nos vemos pronto, con más inteligencia artificial en dot.csv.