He probado la revolución de ChatGPT en la generación de vídeo: así funciona Sora en el móvil
- 2 Días, 12 Horas, 51 Minutos
- XatakaMovil.com
- Tecnología
He probado la revolución de ChatGPT en la generación de vídeo: así funciona Sora en el móvil
Llevaba meses en prueba cerrada para creadores después de que Open AI dejara con la boca abierta tras la presentación de Sora, el generador de vídeo a partir de órdenes de texto. Y al fin pude probarlo: es una enorme revolución en el campo del vídeo. Eso sí, los resultados están aún muy lejos de ser perfectos: Sora es, de momento, el mejor generador de memes en Gif.
Hacer una imagen juntando unas pocas palabras dejó de ser una anécdota, ya que no sólo resulta sencillo, también gratuito. Otra cosa es el vídeo, la siguiente frontera de la IA generativa: pese a que existen varios modelos multimodales capaces de crear clips de vídeo con notable calidad, aún no es una opción mayoritaria. Open AI pretende ser el estándar en este tipo de contenidos.
Sora hace vídeos increíbles, pero necesita demasiados intentos. Y son limitados
Cuando Open AI presentó Sora, la empresa liberó una notable cantidad de vídeos donde se apreciaba el imponente potencial para crear escenas naturales y 100 % fieles a la realidad. También liberó clips surrealistas, alguno con capacidad para generar pesadillas. Y una vez nos llegó a todos los usuarios de ChatGPT Plus, estamos comprobando que Sora está más cerca de lo segundo que de lo primero.
La herramienta de creación de vídeos no es sólo un campo de texto y una biblioteca con los vídeos hechos por otros usuarios, Open AI ha montado un director de metraje capaz de armar películas contándolas palabra por palabra. Permite hacer un vídeo sencillo, pero también crear una película desde cero y escena por escena. Con su propio storyboard escrito.
Pero vayamos a lo importante: ¿qué tal se comporta Sora generando vídeo? Pues lo cierto es que muy bien, el problema es que se encuentra muy lejos de la efectividad que consigue DALL-E 3 en la creación de imágenes, por ejemplo. Es casi como jugar a la lotería: puede salir un clip bueno a la primera, pero se necesita demasiada suerte. E intentos.
Inconsistencias en los planos, en los componentes del vídeo, animaciones que vulneran las leyes de la física, cambios de forma que despiertan risa y miedo a partes iguales. Sora se adentra en el valle inquietante como quien pasa el fin de semana en el campo. Y por eso destacaba lo de «generador de memes» en el titular, basta con mirar los vídeos ya creados para descubrir que hay muy pocos que sean válidos como película.
Para subirlos a Giphy valen la mayoría.
Sora funciona a la perfección en el navegador móvil. Con limitaciones
Como decía, la generación de vídeo de Open AI siempre va a tener un coste, al menos de momento. Por la suscripción de ChatGPT Plus hay 50 generaciones a 720p (20 dólares), para más cantidad se necesita una cuenta profesional (200 dólares). El plan más ajustado limita los segundos máximos de metraje y las resoluciones de vídeo. En los resultados no hay diferencia: la mayoría siguen siendo memes en Gif.
La generación me ha parecido muy rápida: por lo general, y siempre que la petición entra en curso (dependiendo de lo cargados que estén los servidores Sora tarda más o menos en procesar la orden), el vídeo suele estar listo en un minuto (720p y 5 segundos o 420p y 10 segundos). Todas las órdenes se mantienen en cola y se van completando según se ejecutan en el servidor de Open AI.
Aparte de crear un vídeo de cero, Sora admite el remix a partir de otra creación, pueden montarse películas con storyboard, realizar montajes y hasta fusionar clips. Todas las creaciones quedan en la cuenta de usuario y son públicas para el resto. De hecho, Sora dispone de una biblioteca desde la que tomar ideas o hacer remixes para vídeos nuevos. Estos clips no pueden guardarse en el dispositivo, sólo los propios. Y quedan restringidos a los usuarios de ChatGPT premium.
Como es habitual cuando hablamos de novedades en IA generativa, Europa se queda fuera de Sora. No es demasiado problema, ya que basta un VPN, pero no deja de ser un inconveniente.
No es revolucionaria. De momento
Sora no es el primer generador de vídeo, tampoco creo que sea el mejor: herramientas como Gen-3 Alpha o Pika suelen ofrecer mejores resultados. Aunque no hay duda de que Open AI es casi la referencia en IA generativa, por lo que estoy seguro de que terminaremos viendo vídeos que apenas podrán distinguirse de la realidad. Con el riesgo que ello va a suponer y pese a que Sora coloque una marca de agua en cada creación.
Quizá no sea revolucionaria, al menos en lo que a realismo y fidelidad se refiere, pero sí que es muy versátil. Admite órdenes en español (no he apreciado diferencias con el inglés) y con el modo director se pueden crear virguerías. Lo que está por ver es si terminará sustituyendo a los vídeos cortos grabados con cámara. Por mi experiencia, a corto plazo diría que no.
Imagen de portada | Imagen 3 en Gemini editada
En Xataka Móvil | Ni WiFi ni cable ethernet: otras tres maneras de llevar Internet a cualquier habitación de tu casa
En Xataka Móvil | Cómo saber de quién es un número de teléfono sin necesidad de llamar
-
La noticia
He probado la revolución de ChatGPT en la generación de vídeo: así funciona Sora en el móvil
fue publicada originalmente en
Xataka Móvil
por
Iván Linares
.
Comentarios