logo

Dot CSV

Inteligencia Artificial, Tecnología, Ciencia y Futuro! Bienvenidos a la 4ª Revolución Industrial 🚀 Inteligencia Artificial, Tecnología, Ciencia y Futuro! Bienvenidos a la 4ª Revolución Industrial 🚀

Transcribed podcasts: 213
Time transcribed: 5d 22h 50m 3s

This graph shows how many times the word ______ has been mentioned throughout the history of the program.

En este canal muchísimas veces me habéis escuchado decir que, bueno, este paper nuevo nos trae tal novedad
o han sacado un nuevo paper donde presentan tal cosa o, bueno, este paper no contiene código
o directamente este proyecto no contiene paper.
Papers, papers, papers. Hablamos muchísimo de papers y, claro, no fue hasta que recibí este comentario
que no me di cuenta que realmente nunca en el canal me he parado a explicar qué es un paper.
Así que hoy, con la colaboración de Lenovo, quien es quien patrocina este vídeo,
os traigo cinco trucos para que sepáis qué es un paper, cómo tenéis que leerlo, cómo sacar información interesante
y unos cuantos trucos que os va a simplificar la vida a la hora de acceder a esta fuente primaria de conocimiento científico
que es un paper.
En realidad no es un paper esto, esto es un contrato.
Y esto es falso, es que esto es la pantomima del cine, es todo carto... No, esto es madera.
Entonces, ¿qué es un paper? Pues un paper es un artículo escrito,
pero no un artículo escrito de los que te puedas estar imaginándote de una revista o de los que te puedas encontrar en internet,
sino que estamos hablando de un artículo académico.
Un documento que externaliza los resultados de una investigación académica
y que traslada al lector toda la información necesaria para argumentarte algún descubrimiento que hayan alcanzado los autores tras este.
Al final, si el objetivo de un investigador es el de ir ampliando la frontera del conocimiento,
el paper científico actúa como el soporte escrito sobre el que oficialmente este conocimiento es
expresado, difundido y revisado por la comunidad.
Y esto último es algo muy importante de un paper, está revisado por la comunidad.
Es decir, ese documento que tú estás leyendo y que alguien ha escrito
ha pasado por el escrutinio de expertos que pertenecen al campo de estudio de dicho paper
y que verifican la calidad tanto en fondo y en forma de ese artículo.
Seguramente si eres investigador y te dedicas a escribir paper sea este proceso de revisión el que más te torture en tu vida académica.
Ojo, a un paper que todavía no ha sido publicado oficialmente y que por tanto no ha pasado este proceso de verificación
se le conoce como un preprint o prepublicación y aunque esté disponible para acceder a su contenido a través de internet y tú puedas leerlo
ya sabes que esto lo tienes que hacer con un ojo más crítico puesto que este contenido todavía no ha sido verificado por pares.
Si por el contrario ese paper si se ha publicado oficialmente, esto se habrá hecho a través de una editorial
que se encargará de agregar ese trabajo a una revista especializada que podrá tener un mayor o menor impacto.
Y al final, para bien o para mal, si tuviéramos que mirar un poco una función objetivo, una función de coste como tenemos en Machine Learning
para la vida laboral de un investigador esta sería una de las importantes.
¿Cuántas publicaciones tienes en una revista o conferencia que pueda ser de mayor o menor impacto?
Es lo que hay.
De gran impacto seguramente te sonarán revistas como Nature, Cell, Communication of the ACM, Science
y revistas que entre más cerrados sea tu inglés a la hora de pronunciarlas pues más impacto tendrá.
Y claro, aquí rozamos un poco la polémica porque para poder acceder a este conocimiento científico
a esta vanguardia de las ideas, de las mentes humanas que están trabajando y cuyo trabajo se publica a través de estas editoriales
en ocasiones toca pagar y no poco.
Vale, aquí voy a hacer un poco de hincapié para explicar esto que es bastante complejo.
El problema que hay aquí es que este dinero que las editoriales consiguen hacer a través de vender este trabajo de los investigadores
suele quedarse íntegro para ellas, algo que tenía sentido cuando en el siglo XX se dedicaban a hacer laboral de edición
pero ahora en el siglo XXI donde tenemos todas estas herramientas en internet pues no tiene tanto sentido.
¿Cuánto dinero ve un investigador? Ninguno.
Normalmente los clientes de estas editoriales serán universidades o instituciones que requieran de acceder a este conocimiento científico
para que sus investigadores puedan trabajar y en ese caso si tú estás afiliado a cada una de estas instituciones
pues podrás tener acceso a estos artículos.
Esto es algo que si tú actualmente estás estudiando algún título universitario podrás preguntar en la biblioteca de tu centro
donde te darán información de cómo poder acceder a estos contenidos.
Y si por lo que sea no tenéis acceso a un artículo porque no estáis afiliado a ninguna institución
pues siempre se lo podéis pedir por whatsapp a algún amigo que sí está en la universidad y que te lo pueda mandar.
A ver, no quiero incitar yo a usar este tipo de estrategias para saltarse las licencias de los papers
así que tampoco voy a hablar de Scihub, una iniciativa por la apertura de este conocimiento científico
que permite directamente acceder a cualquier paper únicamente escribiendo en su buscador el título o el código de referencia.
Nada de eso, no voy a hablar del tema.
Pero si te voy a hablar del movimiento open access al que cada vez más editoriales e investigadores se van sumando.
En concreto y acentrándonos en el área del machine learning
encontramos que la mayoría de papers están disponibles gratuitamente para leer con libre acceso.
En repositorios de papers como Archive, si hay algún paper que te interese lo más probable es que allí lo puedas encontrar.
Lo buscas y clicando aquí tendrás acceso al PDF, a las diferentes versiones del manuscrito, a todo.
Pero ojo, el contenido que puedas encontrar en Archive no necesariamente tiene que estar verificado por pares,
es decir, son en su mayoría pre-prints, pre-publicaciones.
Así que dependerá de ti y de tu capacidad crítica el poder evaluar si el contenido de ese paper es adecuado
o si por otra parte ya ha sido publicado y por tanto verificado.
El objetivo de este tipo de plataformas es permitir diseminar este conocimiento científico de una manera mucho más ágil,
saltándonos todos los tiempos de espera que normalmente un proceso de verificación requeriría.
Este yo creo que es uno de los grandes motivos junto a la cultura aperturista del campo del machine learning
que ha permitido que éste se desarrolle con tanta celeridad en tan pocos años.
Bueno, que gusto hacer esto, por Dios.
Bueno, con toda esta información ya sobre la mesa, información que creo que es bastante interesante conocer
cuál es el entramado que hay detrás de todo este proceso de publicación de papers,
ahora quiero pasar a contaros cinco trucos o consejos o recomendaciones
para simplificar en la vida a la hora de acceder a este tipo de formatos.
Y para eso el primer truco, recomendación, consejo, es el soporte.
Y vale, lo sé, esto quizás sea algo muy subjetivo y dependerá del gusto de cada persona y su forma de trabajar,
pero yo vengo a daros mi opinión.
Y en este caso además, siendo este vídeo un vídeo patrocinado por Lenovo,
quien me ha hecho llegar este fantástico portátil de su serie Yoga, que llevo probando ya un par de semanas,
pues lo he estado utilizando bastante para esto, para el tema de leer artículos científicos, leer papers,
y ya os digo que para mí ha sido una auténtica pasada por el hecho de que es un portátil súper ligero,
con un montón de autonomía de batería, con lo cual me lo puedo llevar a cualquier sitio
y con un acabado de piel bastante elegante en su cobertura exterior.
Pero no solo eso, tiene una cosa que me encanta y es lo siguiente, ¿vale?
Es un portátil normal, muy ligero, perfecto, pero a lo mejor tú lo quieres utilizar para hacer una lectura
y estar haciendo anotaciones y cosas, pues tú puedes coger el portátil y ¡voilà!
convertirlo a una tablet y la pantalla es táctil, tienes un lapicero incluido que puedes utilizar,
y esto para lo que estamos hablando ahora, el soporte a la hora de leer un artículo científico, es muy importante.
Porque al final, si la idea es sentarnos a leer un paper para poder extraer todo su conocimiento,
desentrañar todos sus misterios, construir un entendimiento de lo que nos quieren plasmar sus autores,
pues siempre viene muy bien sentarte con el paper y poder trabajar todo su contenido,
poder ir haciendo anotaciones, subrayar aquello que te parezca interesante y aquello que no,
pues ir haciendo comentarios, pues por ejemplo esto, esto está mal, esto aquí pues no lo he entendido,
este señor me tomó una cerveza con él una vez en un sitio, yo qué sé, cosas así que sean relevantes a la hora de trabajar el paper.
La idea es que al final tú te sientas cómodo con el soporte que estés trabajando,
y esto puede ser directamente trabajar con una tablet que te permita hacer anotaciones
o directamente imprimirte el paper y hacer anotaciones a boli.
Yo por ejemplo, cuando estaba estudiando en la Universidad de Finlandia,
pues me gustaba mucho ir con mi carpetita llena de papers impresos y ir haciendo anotaciones
y tenerlos ahí como si fuera algo bastante, wow, soy el más erudito de la facultad,
pero luego la realidad es que sí me gusta mucho trabajar con algún soporte digital,
con una tablet que me permita hacer todas las anotaciones que necesito
y al mismo tiempo ir comprobando información en internet, pues diferentes referencias,
el abrir un blog para entender este concepto que me están hablando y no lo terminan de entender,
es decir, al final la flexibilidad que te da el trabajar con un soporte escrito
y luego también pues la accesibilidad que te da el trabajar con un soporte digital
que directamente puede buscar toda la información en internet,
abriendo muchas pestañas y trabajas mucho más cómodo.
Es flexibilidad como la que nos da nuestro fantástico portátil Lenovo Yoga.
Segundo punto.
Vale, ya estás cómodo, ya tienes tu paper delante, tienes el cafecito preparado,
tienes una larga tarde para sentarte a leer artículos, y ahora qué, ¿cómo lo lees?
Pues aquí lo que tienes que entender es que generalmente un paper se divide
en distintas secciones que por lo general suelen ser iguales en diferentes artículos.
Estas son el abstract, un resumen a modo de presentación del contenido que tiene el artículo,
la introducción, presentación del problema que se resuelve, trabajo relacionado para presentar
la línea de investigación a la que pertenece el paper y esto es muy interesante para sacar
mucha más bibliografía relacionada con el tema que está tratando, materiales y métodos
donde se explica el cómo se ha resuelto el problema y aquí donde encontraremos realmente
la mayor parte de fórmulas, pseudocódigos, detalle de la implementación, vamos, el cómo
lo hacen del trabajo y luego la chicha del asunto, los experimentos y resultados realizados,
la sección donde más gráfica, visualizaciones y tablas vamos a encontrar.
Finalmente encontraremos las conclusiones y las referencias y si procede pues también
encontraremos más documentación anexa que profundizará en más aspectos de los métodos
y experimentos.
Esta estructura suele ser general en la mayoría de papers aunque puede variar en
diferentes campos de estudio, no siempre el formato que se sigue es exactamente igual
en los papers de Machine Learning que en un paper biomédico.
Perfecto, pero ¿cómo lo leemos?
Vale, ahí vamos.
Conociendo las secciones del paper pues ya te puedo decir que lo primero que harás
evidentemente será leerte el abstract y con eso ya tendrás mucha información para saber
si quieres seguir profundizando o no en el contenido de dicho paper y luego dependerá
un poco de cuánto tiempo quieras dedicar y cuál sea tu nivel de conocimiento o tu
agilidad a la hora de leer papers que dedicarás más tiempo a unas secciones u otras.
Si por ejemplo eres una persona que no conoces el tema que el paper está tratando, seguramente
te interese pararte por la parte de introducción, contenido relacionado y a lo mejor también
te viene bien saltar directamente a la conclusión para entender un poco cuál va a ser la línea
por la que se va a mover el paper.
Esto lo que te va a permitir es tener un contexto, una visión más general de dónde se sitúa
este trabajo dentro de toda la línea de investigación a la que ese paper quiere atacar.
Esto para que lo entendáis es un poco lo que yo me suelo dedicar a hacer en mi canal
de YouTube, cuando yo os presento un trabajo normalmente me centro mucho en contextualizarlo
dentro de esta línea de investigación para que podáis entender cuáles son las implicaciones
de dicho trabajo.
Una persona que no conoce el campo de estudio de ese paper pues podrá encontrar mucha información
relevante en esos apartados y ya cuando tengas un mayor conocimiento del tema del que va
el paper pues ya si te puedes saltar a la zona de métodos y experimentos y entender
todo el trabajo que han hecho.
Lo normal es que un investigador que ya esté muy acostumbrado a leer sobre ciertos temas
es que vaya directamente a esta zona del paper, se focaliza y su atención y directamente
se salte puesto a la introducción, trabajos relacionados, etcétera.
Sobre esto quiero compartiros un recurso que me dieron cuando estudiaba el máster en la
asignatura de comunicación científica y es un paper, vale, es un paper sobre cómo
leer un paper.
Bueno, quiero aclarar que esta broma que acabáis de ver tiene derechos de propiedad, pertenece
a Sandra del canal La Hyperactina quien de buena manera me ha obligado a decir que esta
broma si la incluía en el guión tenía que efectivamente decir que era ella la persona
que lo ha propuesto.
Un paper sobre cómo leer un paper, vale, es un documento que está bastante bien, es
muy rápido de leer, lo voy a dejar abajo en la caja de descripción, pero bueno, en
resumen lo que viene a presentar es una estrategia de lectura de papers que yo normalmente sigo
y es leerlo en tres pases.
El primero es un pase rápido donde vas a leer el abstract y vas a decidir si realmente
te interesa o no.
Una segunda lectura bastante rápida, pasando por encima sin mirar pues la fórmula, el
pseudocódigo, sin intentar entender todas las demostraciones, sino simplemente leyendo
el paper y entendiendo de qué te hablan.
Y luego en el tercer pase ya si vas a profundizar en todo esto y tienes que llegar a un nivel
de entendimiento donde virtualmente tú puedas reproducir el contenido de lo que estás leyendo.
Es una estrategia bastante interesante que te va a permitir dedicarle el tiempo necesario
a cada parte según lo vayas necesitando.
Tercer truco entiende la perspectiva académica desde la que te están hablando.
¿Qué significa esto?
Bueno, esto puede sonar obvio para algunas personas, pero es algo que yo tuve que descubrir
a lo largo de leer muchos papers y es lo siguiente, y es que solemos pensar que al tratarse de
estos documentos científicos, pues el conocimiento que nos están expresando se hace de una manera
rigurosa donde todos los conceptos siguen una nomenclatura estándar que ha sido consensuado
durante décadas.
No, no suele ser así, de hecho suele ser lo contrario.
Si lo pensamos, por ejemplo, el campo de la inteligencia artificial no deja de ser un
paraguas que engloba a muchísimas subdisciplinas que vienen de vertientes científicas muy
distintas, por ejemplo, matemáticas, procesamiento de señales, visión por ordenador, lingüística,
son campos de estudio donde cada uno tiene una forma diferente de expresar las mismas
ideas.
Y esto lo que hace es que a lo mejor en un paper te estén explicando lo que es una red
neuronal a partir de su arquitectura de capas y en otro paper te lo estén explicando como
un algoritmo de procesamiento de señales y en otro paper te lo estén explicando como
una especie de fórmulas de probabilidad vallesiana y donde todo representa la misma cosa, pero
te lo están explicando de maneras muy diferentes, de las cuales a lo mejor solo vas a entender
una o ninguna.
Y para esto no queda otra, si algo nos ha enseñado Nerf es que para entender bien un
concepto hay que analizarlo desde todas sus perspectivas y esto es que, bueno, pues te
tienes que empapar el temario si realmente quieres conocer el contenido de ese paper
y si por lo contrario lo que quieres es centrarte en una perspectiva determinada, pues quiero
saber más de redes neuronales pero entendidas desde la perspectiva de la estadística vallesiana.
Pues en ese caso lo que tendrías que hacer sería buscar aquellas publicaciones que compartan
revista o que compartan conferencia, que normalmente van a tener un enfoque similar.
Truco, consejo, dogma número 4.
La rajación.
Esto empieza a pasar cuando llego a la hora número dos de grabación en un vídeo.
La rajación.
Busca opiniones de este paper.
Aprende a ser crítico.
Cuando leas un paper tienes que entender que sí, que esto ha sido un documento que ha
pasado una prueba de verificación, pero claro, que esto no lo convierte en un documento a
prueba de errores, más aún si estamos en el caso de estar leyendo prepublicaciones.
Ahí lo que te recomiendo es que siempre mantengas una visión crítica según vayas leyendo
el paper y que te estés cuestionando en todo momento si lo que te están contando está
bien.
Metodológicamente está bien, los resultados están bien presentados, las gráficas y visualizaciones
siguen buenas prácticas, resuelve el paper el problema que propone, es consistente entre
páginas con la nomenclatura que usa, ¿realmente ese paper avanza en la línea de investigación
o es un avance más progresivo que no tiene tanto impacto?
Existen un montón de buenas y malas prácticas en las que se pueden incurrir a la hora de
escribir un paper y conocerlas como lector está bastante bien.
En este caso, una cosa que yo suelo hacer es buscar discusiones en foros de Reddit o
discusiones en hilos de Twitter entre investigadores o directamente irte a la página Open Review
y ver cómo gente muy lista y muy ácida suele atacar este tipo de trabajos para realmente
ir aprendiendo pues cuáles son los puntos flacos de cada uno de ellos.
En este sentido me viene a la cabeza y aprovecho para recomendaros el canal de Yannick Kilcher,
quien no solo hace unas explicaciones espectaculares y bastante inmediatas de los papers más relevantes
que se van publicando, sino que además en su experiencia como investigador y también
como reviewer de papers suele mezclar estas explicaciones con valoraciones y opiniones
personales de por qué ese paper a lo mejor metodológicamente no está tan bien, algo
de lo cual se puede aprender muchísimo y algo que realmente nos conecta con el último
punto.
Punto número cinco, no leas papers solo, o sea, no me refiero a que no leas paper en
compañía ni solo, me refiero a que no leas solo papers o dicho de otra manera se multimodal
acude a diferentes fuentes para aprender sobre el tema que te interese.
Esto es mi opinión personal y creo que queda muy bien dentro de este vídeo donde te estoy
enseñando a leer un paper y es que no me gustan los papers, o sea, sí me gustan desde
el punto de vista en el que puedo entender para qué son útiles los papers, pero no me
gusta como medio divulgativo o medio para acceder a esta información para gente que
a lo mejor no esté tan especializada en un campo de estudio.
Creo que no es un formato adecuado que todavía no se ha actualizado a lo que es el siglo
21.
Y esta opinión se refuerza más aún cuando veo la cantidad de contenido de calidad que
existe, por ejemplo, en el campo de la inteligencia artificial, donde existen artículos de una
altísima calidad pedagógica y que además son súper dinámicos a la hora de presentarte
el contenido y que buscan que tú puedas entender exactamente ese conocimiento.
Y es por eso que te invito a que si estás leyendo un paper y no terminas de entenderlo,
no pienses que tienes que pasar por esa barrera para llegar a ese contenido.
En nuestro campo existen también muchísimas alternativas que te van a permitir acceder
a este conocimiento, pues, por ejemplo, en artículos especializados en blogs como Medium.
Buscar la página del proyecto de dicho paper, donde posiblemente los autores hayan hecho
una labor pedagógica para que un público más general pueda acceder a ese contenido.
Buscar discusiones en foros o si a lo mejor eres una persona más técnica, ir a buscar
el código en GitHub si estuviera disponible.
Si eres una persona a la que le interesa esto último, seguramente te interese también
conocer la página Papers with Code, que lista muchos de estas publicaciones que además
tienen asociadas un repositorio en GitHub donde puedes acceder al código y estar investigando.
Pero mi opinión personal va por ahí.
Al final un paper no deja de ser una herramienta para poder transmitir conocimientos y creo
que a día de hoy contamos con muchísimas soluciones a través de Internet que nos demuestran
que una mejor pedagogía se pueda hacer.
Un caso de éxito que a mí me gusta enseñar mucho es la página web distill.puff, que
además de presentar artículos con una profundidad técnica bastante relevante, lo hace a través
de mecanismos interactivos que permiten que cualquier lector pueda acceder a este conocimiento
de una manera mucho más accesible.
Igualmente, y este es un miniconcejo final, si queréis profundizar en el contenido de
un paper y poder tener un mejor entendimiento, siempre pone idea configurar grupos de estudio
o seminario donde varias personas puedan leerlo y entre todos compartáis vuestra visión
y podéis hacer un poco esta actividad de mente colmena para entre todos desentrañar
los misterios de ese paper.
Si queréis probar suerte y tenéis algún tema que os pueda interesar de los vídeos
que anteriormente hemos presentado aquí en el canal, sabéis que abajo en la caja de
descripción yo suelo dejar las referencias y artículos científicos de los temas que
vamos tratando.
Si quieres practicar esto de leer papers, pues te vayas a algún vídeo que te haya
gustado, busques ese paper y lo leas.
Nada más, muchas gracias por ver este vídeo, muchas gracias de nuevo a Lenovo por haberlo
patrocinado y ya sabéis que podéis apoyar también el contenido de este canal a través
de Patreon.
También encontraréis el enlace abajo en la caja de descripción.
Chicos, chicas, nos vemos más con inteligencia artificial vídeo en este canal, adiós, próximo.