image image image image image image

Viernes de GenAI News – 02/08/24

¡Las últimas novedades en IA que te van a volar la cabeza! 🤯

¡Hola, gente! ¿Están listos para ponerse al día con las últimas locuras del mundo de la IA? Agarrensé fuerte porque vamos a hacer un recorrido por las novedades de esta semana. Ya sea que seas un experto en tecnología o simplemente te cope todo este tema de la inteligencia artificial, hay algo para todos. ¡Vamos allá!

Índice

  1. Meta y su modelo de edición de videos SAM 2
  2. Extensiones en Google Gemini
  3. Modelo de voz natural y sentimiento en ChatGPT
  4. Vidu: el nuevo crack de la generación de videos
  5. Flux: la nueva estrella del OpenSource
  6. Gemma 2: Google contraataca

1. Meta y su modelo de edición de videos SAM 2

Parece que en este momento la competencia de IA’s se centró en los modelos de generación de videos. Hoy tenemos un montón: Runway, Kling, Dream Machine, PikaLabs y siguen sumándose. Pero ojo, que Meta no se queda atrás y viene con todo con su modelo SAM 2.

¿Y qué hace este coso? Nada más y nada menos que detectar objetos en un video y seguirlos frame por frame. ¿Te imaginás lo que significa esto para la edición de videos? ¡Es una locura! Vas a poder agregar efectos, transformar objetos y hacer mil cosas más re fácil.

Ya se pueden ver ejemplos en video de cómo agarra un objeto y lo sigue durante toda la escena. Es como tener un editor de video superinteligente que no pierde de vista nada.

Si querés saber más detalles técnicos y ver ejemplos, date una vuelta por este artículo de Xataka.

Video Ejemplo


2. Extensiones en Google Gemini

Google no se queda atrás y acaba de anunciar: ¡extensiones para Gemini! Ahora podés integrar esta IA con YouTube, Google Maps, Gmail, Drive y más. ¿Te imaginás lo fácil que va a ser buscar ese documento que juraste que guardaste pero no sabés dónde? ¿O encontrar ese video de YouTube que viste hace meses pero no te acordás el nombre?

Lo mejor de todo es que es gratis. Sí, como lo escuchás, ¡GRA-TIS! Solo tenés que ir a la ruedita en la parte inferior izquierda, seleccionar extensiones y elegir con qué servicios querés que Gemini se integre.


Interfaz de selección de extensiones en Gemini

Para todos los detalles y un tutorial paso a paso, pegale una mirada a esta guía en Xataka.

3. Modelo de voz natural y sentimiento en ChatGPT

Esta semana empezaron a habilitar a algunos usuarios para el uso del modelo de voz natural en ChatGPT. Y dejame decirte, está causando más revuelo que un partido de Boca-River.

La gente está generando conversaciones de lo más locas y los resultados son… bueno, vas a tener que escucharlo para creerlo. Pero ojo, no te emociones demasiado si no sos usuario pago. Por ahora, solo los usuarios premium tienen acceso a esta joya.

Se espera que en las próximas semanas llegue a todos los usuarios premium. Así que si querés hablar con tu IA como si fuera tu mejor amigo (o tu peor enemigo, depende del día), ya sabés lo que tenés que hacer.


Interfaz de ChatGPT con el nuevo modelo de voz

Para más detalles y algunos ejemplos pasate por este artículo de Xataka.

4. Vidu: el nuevo crack de la generación de videos

¿Te acordás cuando te dije que la batalla estaba en la generación de videos? Bueno, Vidu acaba de entrar en la cancha y viene pegando fuerte. Este modelo es como Runway, pero recargado.

¿Qué hace? Simple: agarrás una imagen estática, le decís «Che, quiero que este mate empiece a bailar salsa» (o lo que se te ocurra), y ¡PAM! Vidu hace su magia y crea un video a partir de esa imagen siguiendo tus instrucciones.

Lo más impresionante es la consistencia. Mantiene la imagen, objeto o personaje central como un campeón. Y lo mejor de todo… ¡ES GRATIS!


Ejemplo de antes y después usando Vidu

No pierdas tiempo y andá a probar esta maravilla en la página oficial de Vidu.

5. Flux: la nueva estrella de generación de imágenes

Atención todos los fanáticos de Stable Diffusion: hay un nuevo genio en la ciudad y se llama Flux. Este modelo de generación de imágenes es OpenSource, lo que significa que podés jugar con él tanto online como en tu propia máquina. ¡La democracia de la IA en su máxima expresión!

La comunidad está tan revolucionada que ya están diciendo que SD3 (Stable Diffusion 3) murió. Tremendas palabras, ¿no? Pero cuando veas las comparativas, vas a entender por qué están todos tan alborotados.


Comparativa visual entre Flux y SD3

Acá podes ver las comparativas que te mencionaba, date una vuelta por este hilo de Reddit.

¿Querés probarlo vos mismo? Entrá a esta versión rápida en Poe y preparate para alucinar. Y si tenés ganas de probar más cosas, acordate que hay otras versiones dentro de Poe.

6. Gemma 2: Google contraataca

Google no se queda de brazos cruzados y larga Gemma 2. Parece que se pusieron las pilas después de que Gemini no causara tanto revuelo como esperaban (entre nos, yo tampoco quedé muy impresionado).

Pero ojo, que con Gemma 2 la cosa cambia. Los benchmarks la ubican por encima de Gemini, así que algo bien deben haber hecho esta vez. ¿Será que por fin le pueden plantar cara a los grandes?


Gráfico comparativo de benchmarks entre Gemma 2 y otros modelos de IA

Si querés comprobarlo vos mismo (y de paso ver si le gana a ChatGPT en una batalla de ingenio), podés probarla acá en Poe.

👉 ¡Sumate a nuestra Bit AI Community y seguinos también en LinkedIn para no perderte ningún movimiento en esta carrera de la IA!

Deja una respuesta