logo

midulive


Transcribed podcasts: 605
Time transcribed: 13d 3h 7m 36s

This graph shows how many times the word ______ has been mentioned throughout the history of the program.

Google ha sacado su nueva inteligencia artificial, Google Gemini, Gemini, Gemini, no sé cómo le queráis llamar, le podéis llamar, no sé cómo se pronunciará, le vamos a decir en español Gemini, la era de Gemini, tenemos nueva inteligencia artificial, ahora ya salen como churros, o sea, ya cada semana vamos a tener una nueva, porque la semana pasada Amazon sacó Q, Q asterisk, ¿vale?
Todos, todos, cada dos por tres vamos a sacar una inteligencia artificial nueva, porque Google ya tenía la suya, pero esta es la nueva versión remozada y re mejorada, es verdad que tiene muy buena pinta y lo vamos a ver, y vamos a ver, y vamos a hablar también del salseo que hubo con las acusaciones reales, además, contra Google por su inteligencia artificial, porque falseó ciertas cosas, ¿vale?
Lo vamos a ver, esta es la página web, muy bonita, por cierto, si me preguntáis, pues aquí estamos con la era de Gemini, o Gemini, o como le quieras decir, lo más importante que tiene esta nueva inteligencia artificial, que lo vamos a tener ya en todas seguro, es el hecho de la multimodalidad, o sea, que va a poder funcionar tanto con texto, imágenes, vídeo, audio, código, con un perro, con un gato, con tu familia, con quien sea, con todo, con todo, y está muy bien, obviamente, ¿no?
El hecho, ya lo habréis visto con ChaGPT, con ChaGPT, si tú le hablas y le dices, quiero que me crees una imagen de esto, pues ya te lo hace, le puedes pasar una imagen y la entiende, este tipo de cosas van a pasar ya, vamos, por todos los siglos.
Y en esta nueva era, aquí tenemos al CEO de Google, que nunca me acuerdo cómo se llama, porque tiene un nombre bastante complicado, la verdad, pero bueno, que estaba ahí anunciándolo.
¿Qué es lo más importante que ha vuelto, que ha shackeado un poco el mundo de la inteligencia artificial, la programación y todo?
Pues amigos, ojo, cuidado, porque Google ha comentado que Gemini Ultra es más lista, no que un experto humano, que eso ya lo sabíamos, sino que también le ha ganado en un montón de métricas a GPT-4, a GPT-4.
Fijaos, Gemini es el primer modelo que mejora incluso a un experto humano en Massive Multitags Language Understanding, uno de los métodos más populares para testear el conocimiento y los problemas para resolver habilidades de los modelos de inteligencia artificial.
O sea, se supone que este modelo de Google es más listo, bueno, más listo es un poco, que funciona mejor que GPT-4 en general.
Esto está por ver, por demostrar sobre todo, ¿vale? Pero los datos, en los métodos que ellos tienen por aquí, sobre todo con Gemini Ultra, que me imagino que es el más caro, ¿eh?
Porque entendemos, ojo, entendamos que hay diferentes versiones y esta será la más cara, la que tardará más tiempo a lo mejor en responder.
No estamos hablando tanto de tiempos aquí, sino más bien de razonamiento, ¿no? De cómo van a dar bien los datos.
Y aquí tenéis algunas comparaciones con GPT-4, ¿vale? GPT-4. Y fijaos que en todas, menos una, que justamente es la de sentido común para reaccionar, iba a decir, para...
Joder, no me sale la palabra. Bueno, para... A ver, decídmelo en el chat, que seguro me lo decís antes. Me lo vais a decir, razonar, eso no me salía.
Razonar, para razonar. Sentido común, para razonar las tareas del día a día. O sea, para esto no va tan bien, ¿vale? Para razonar no va tan bien.
¿Sabéis qué me ha pasado? Que estaba intentando todo el rato ahí razonar, razonar. Estaba intentando el EA, EA, EA.
Sí, están guarreando las métricas, dice Seldar, pero Midu, fíjate que pone COT-32 y GPT-4 es distinto.
Bueno, claro. Es que ya nos podemos imaginar que habrá algunas cositas que, por ejemplo, la manera en cómo la han comparado no es exactamente igual.
Aquí pone número de APIs por cada... O sea, es una métrica un poquito así, ya sabéis cómo son las métricas.
O sea, las métricas al final tú las puedes toquetear un poquito y ya la está, ya está, ¿sabes? Ya las puedes cambiar un poco.
Pero lo interesante, queramos o no, es que lo cierto es que tenemos aquí mejores, mejores resultados que GPT-4 en todo,
excepto razonando las tareas comunes, ¿vale? Del sentido común.
Y aquí tenéis, pues, otras más. Estas son las de GPT-4 Vision. Estas serían para imágenes y vídeo, ¿vale?
El tema de la multimodalidad, al pasarle una imagen, al pasarle un vídeo, al pasarle un audio, pues en todas estas parece ser que Gemini funciona mucho mejor que GPT-4.
Y fijaos que viene en tres tamaños, Nano, Pro y Ultra, que Ultra es, digamos, la más potente, la que será más cara y todo esto.
¿Qué ha pasado con este pedazo de anuncio de Google que tenía tan buena pinta?
Bueno, aquí tenemos un montón de demos, un montón de vídeos, un montón de historias.
Ya veis que lo podéis intentar utilizar en BART, no sé si todo el mundo ya tiene acceso, pero lo podéis intentar, a ver si tenéis acceso.
Yo creo que no todo el mundo tiene acceso, aunque sí que es verdad que, fijaos, que aquí ahora ya tenéis lo de subir una imagen y todo esto.
No sé si será la Ultra, no lo sé, tengo dudas, porque pone experiencia.
Ah, Gemini Pro, dice que es Gemini Pro. Bueno, pues ya podríais probar la Pro.
Pero claro, ¿qué pasa? Que la Pro no es la que se compara aquí. Si os fijáis, la que pone aquí es la Ultra, no es la Pro.
Entonces ya nos están engañando, ya nos están engañando. Pero, aún así, tiene buena pinta.
Pero, ¿qué ha pachado? ¿Qué ha pachado con todo esto? Lo que ha pasado, amigos, ha sido el vídeo que sacó Gemini, ¿vale?
O sea, la gente de Google, a ver si os lo enseño, voy a ver si encuentro, o lo enseño muy por encima, ¿eh?
El vídeo que sacaron. Es este vídeo, ¿vale? Este es el vídeo que sacaron, ¿ok?
¿Qué entonces qué pasa? Bueno, aquí lo que te hacían era demostrarte cómo funcionaba la inteligencia artificial.
Dice, este vídeo, pues, resalta alguna de nuestras interacciones favoritas con Gemini.
¿Ok? Entonces, ¿qué pasa? Pues claro, aquí iba dibujando, era como si parecía que era en tiempo real,
que iba dibujando y aquí la inteligencia artificial iba contestando, ¿ok?
Y fijaos que lo hacía como de una forma muy natural.
Porque, fijaos que conforme ibas escribiendo, ah, vale, pues ahora no, ahora aparece esto.
Mira, pues, es raro, ahora el pato parece azul, pero no es común que los patos sean azules.
Y ahora le saca un pato azul y le dice, ah, pues sí, sí que hay patos azules. Muy bien, ¿ves?
Y ahora, como que parece más... Anda, qué cuac, muy bien, pues ahora sí que hay azul. Muy bien, pues me parece fantástico.
Entonces, esto es una demo bastante potente que nos voló un poco la cabeza porque decías,
madre mía, qué bien funcionaba en tiempo real, cómo iba...
Pero ¿sabéis qué pasa? Ya cuando se ve tan arreglado todo, ya huele...
Huele, huele a humo. ¡Hay humo! ¡Hay humo! ¡Hay humo!
Y hay humo, sí, hay humo, hay humo. Efectivamente hay humo.
Y es que, ¿qué es lo que ha pasado con todo esto?
Pues que todo esto que te enseñaba como todo lo que podía hacer con multimodalidad,
con imágenes y todo esto, pues ¿qué ha pasado?
Acusan a Google de falsear el vídeo de demostración de Gemini,
su nuevo modelo de inteligencia artificial.
Se ha liado bastante parda, ¿vale?
Se ha liado bastante parda y ya se ha confirmado
que el vídeo no se hizo en tiempo real, ¿vale?
El vídeo no se hizo en tiempo real.
O sea, está todo, todo lo que veis está totalmente preparado.
Claro, no es lo mismo el cómo nos habían dicho que había sido
y han tenido y han sacado un artículo, ¿vale?
Han sacado un artículo donde básicamente han explicado cómo hicieron esto.
Y entonces, ¿qué pasa?
Que ya se va viendo que le están, ¿veis?
También le va escribiendo como, ¿qué es lo que crees que estoy haciendo?
Es un juego.
Sabes, claro, pista, es un juego.
No jodas, no jodas.
¿Cuántos dedos tengo?
Pista, pueden ser dos.
Pueden ser dos.
A ver, si eres tan inteligente.
Hombre, a ver, es un poco trampa.
Es un poco trampa, claro.
Cuando también le vas a decir,
oye, estoy dibujando un animal.
¿Qué animal?
¿Qué pájaro crees que es?
¿Qué pájaro crees que es?
Claro.
Entonces, se puede ver como en diferentes momentos
le está dando como algunas indicaciones
que le ayudan a la contestación.
Entonces, tú ves el vídeo y el vídeo no corresponde nada
con la realidad de lo que se ve en el artículo,
de cómo lo han hecho.
Que está bien que al final han sacado el artículo
como explicando cómo funciona la multimodalidad,
pero es verdad que al final se ve un poco el truco.
Tiene muy buena pinta Gemini, o sea, las cosas como son,
pero es una pena el hecho de que hayan tenido que...
Creo que hubiera sido mucho mejor una demostración cruda,
¿sabes?
De que se vea la interfaz utilizándolo y ya está.
Y claro, ¿ahora qué es lo que pasa?
Pues que ya empezamos un poco con la mosca detrás de la oreja
de que si realmente esto es fiable, no es fiable.
Es verdad que Google Bar ha mejorado, que funciona mejor,
pero tampoco veo que sea mejor que GPT-4,
ni mucho menos en esto, ¿vale?
Entonces, no sé.
Estamos mal acostumbrados con las demos de OpenAI,
lo normal es lo que ha hecho Google.
Eso es verdad, pero ¿sabéis qué pasa?
La mejor demo es cuando tú tienes el producto,
lo usas y te vuela la cabeza,
como nos pasó con ChaGPT en su momento.
¿Sabes?
Que no sé, que tú ves una demo de ChaGPT
y es que es lo que se puede hacer, ¿no?
Y eso está muy bien, porque es verdad que exageraba,
no sé, que estaban bastante bien hechas
las demos de ChaGPT y tal,
pero es que luego tú lo probabas y decías,
bueno, te podías fallar un poquito más, un poquito menos,
pero era la UX, era la UX real.
Y eso estaba súper bien, ¿eh?
O sea, las cosas como son.
Pero la de OpenAI todas han estado disponibles,
como la demo de la Devday.
Sí, sí, no, eso es lo mejor.
La mejor demo que puedes hacer
es la que el usuario puede replicar
sin ningún tipo de problema.
Y en esto, pues creo que a Google se le ha ido un poco,
se le ha ido, se le ha subido un poco ahí
en la cabeza del palo.
Mira qué chulo lo que hago, no sé qué.
Y claro, es que claro, es un poco...
Mira, aquí se ve el tema este.
¿Ves?
Mira, está haciendo que parece que sea una...
Claro, esto parece que está súper chulo,
pero luego te pones a mirar por aquí,
¿ves?
Y le vuelve a decir, es un juego.
Y dice, vale, estás jugando.
Y puedes ver el pattern que estoy jugando, ¿sabes?
Es como que le va cada dos por tres, ¿no?
Como le va indicando un poquito.
Lo cual, a ver, está bien, pero no es lo mismo.
No es lo mismo.
Yo creo, bueno, yo creo, no.
Estoy bastante convencido que hay que tener en cuenta
que esta inteligencia artificial la vamos a disfrutar
en tres ámbitos, ¿no?
En tres ámbitos.
Google Gemini lo vamos a disfrutar en tres ámbitos
muy potentes, obviamente.
La primera que vamos a tener, obviamente,
va a ser en Google Bar, que es donde ya la tenemos.
Ya en Google Bar, pues la vamos a poder tener aquí.
Mira, va a acabar de actualizarse,
ver actualización y ya te dicen que están utilizando
justamente Gemini Pro.
OK.
Entonces, una va a ser en Gemini, ¿OK?
Que lo vamos a tener aquí.
Ahí en Google Bar lo vamos a tener ahí funcionando.
La segunda, yo estoy seguro que esta inteligencia artificial
es la que va a ejecutarse detrás de un montón de las cosas
y productos que veamos a ir viendo en Google.
Por ejemplo, el nuevo buscador, que todavía no lo han sacado
y estaban tardando, yo creo que estaban esperando justamente
a tener esto listo.
Ya sabéis, el nuevo Google News Search AI.
A ver si lo encontramos.
No sé, generative, no creo, este no, este creo que no es,
este creo que no es.
Ah, sí, este, este, este.
Vamos a ver, ¿eh?
Esto va a llegar, obviamente, va a llegar, está llegando
y veis, la búsqueda ahora va a ser así.
Pero fijaos el impacto que va a tener esto en el mundo del SEO,
en el mundo de muchas cosas, cómo va a cambiar esto,
que va a ser muy brutal, ¿eh?
Porque fijaos ahora que lo que vamos a tener es,
a ver si le puedo dar, mira, claro, tú buscas,
le das a buscar con Google, sí, te sale aquí generando,
aquí tienes los resultados y mira, a tomar por saco resultados.
A tomar por saco resultados, aquí le importan los resultados.
Claro, entonces se va a perder muchos clics,
se van a perder ahí, ¿eh?
Muchos clics.
A ver qué pasa con el SEO, con esto, está por ver, está por ver.
Y luego la tercera, obviamente, como un servicio
que vamos a tener en Google Cloud.
Google Cloud seguro vamos a tener, bueno, seguro no,
esto es 100% seguro, vamos a tener una API disponible,
como tenemos la de GPT-4, para que la podamos utilizar,
veremos los precios, a ver si está muy bien.
Creo que todavía no han salido, no sé si Gemini,
API, Google, no sé si han salido ya los precios.
Sé que hay un Early Access, o sea,
que ya está disponible para algunas personas,
pero a partir del 13 de diciembre, mira,
pues sale dentro de dos días y es solo para desarrolladores.
A partir del 13 de diciembre los desarrolladores de empresas
pueden acceder a Gemini Pro mediante la API.
Y entonces ahí lo vamos a ver.
Entonces, todos los productos, Google Search, Google Docs,
Gmail y todo esto, van a utilizar esta API.
Por otro lado, Google Bart, que al final no deja de ser otro producto.
Y la API que vamos a tener accesible para todos.
Vamos a ver qué tal.
El tema, yo creo que está por ver la API,
cómo de rápida es y todo esto, y cómo de cara es.
A ver si realmente es una alternativa a ChatGPT, a GPT-4,
más en el tema de la API.
Y sobre el tema de las web apps, yo lo que sí que creo
es que cada vez más Google va a ser que casi no va a valer la pena
ni intentar aparecer en Google y vamos a tener que utilizar
otro tipo de estrategias porque va a ser increíblemente difícil.
Si ya cuando buscáis en Google, yo qué sé,
si buscáis zapatillas de running, buscáis zapatillas de running,
y bueno, ah, bueno, claro, porque tengo la publicidad quitada,
pero es que si ya no te sale ni un resultado patrocinado,
patrocinado, patrocinado.
O sea, todo lo que es el viewport ya lo tienes patrocinado.
Pues imagínate cuando encima te venga la inteligencia artificial
ahí en medio para meterte.
Te hago más zapatillas de running, ahí lo vas a tener.
Las cosas como son, ¿eh?
Ay, qué risa.