fbpx

Qué es y cómo funciona Sora, la nueva inteligencia artificial de OpenAI

Sora puede crear vídeos de calidad óptima a partir de texto

OpenAI, la compañía especializada en inteligencia artificial anunciaba este mes el lanzamiento de Sora, su nuevo modelo de IA. Se trata de una herramienta prometedora que puede generar vídeos de altísima calidad a partir de indicaciones en texto. OpenAI ya revolucionó en 2022 el mercado de la IA al lanzar ChatGPT, seduciendo a figuras tan icónicas del sector tecnológico como Bill Gates.

A estas alturas, ChatGPT se ha consagrado como la IA más famosa del momento. Ahora, la empresa responsable del popular chatbot y DALL-E, anuncia una herramienta que promete revolucionar no solo el mercado de la IA, sino también la industria audiovisual.

Sora permitiría a sus usuarios la creación de vídeos de óptima calidad a partir de prompts. ¿Aún no sabes qué es un prompt? Pues bien, se trata de las indicaciones que los humanos brindan a la IA, en formato de texto, para obtener una respuesta acorde a sus intereses. En definitiva, los prompts se podrían definir como la forma en la que los humanos se comunican con la IA.

En las primeras demostraciones, Sora demuestra que puede crear secuencias dignas de estar en una película, dotando a los protagonistas del vídeo de emociones y expresiones totalmente reales. ¿Imaginas poder crear películas a partir prompts? El futuro de la inteligencia artificial promete ser sorprendente a la par que inquietante.

¿De qué es capaz Sora?

Sora es capaz de generar escenas complejas con varios personajes o figuras en movimiento, incluyendo datos precisos del sujeto y del escenario que le rodea. De manera que la IA comprende no solo lo que el usuario le pide, sino que entiende la existencia de esas cosas en el mundo. Por lo tanto, Sora tiene la capacidad de generar vídeos enteros de una sola vez o de ampliar los vídeos generados para hacerlos más largos.

Por lo tanto, Sora puede generar un vídeo partiendo únicamente de instrucciones en texto, pero también es capaz de crear un vídeo a partir de una imagen fija ya existente, prestando atención a los pequeños detalles.

Sora también puede crear varias tomas dentro de un mismo vídeo generado, en el que perduren con precisión los personajes y el estilo visual.

¿Cómo es posible? OpenAI ha desvelado su funcionamiento a través del blog de la compañía. La herramienta utilizaría la técnica de recapitulación de DALL-E 3, que consiste en generar subtítulos muy descriptivos para los datos visuales de entrenamiento. Como resultado, el modelo es capaz de seguir más fielmente las instrucciones de texto del usuario en el vídeo generado. Tal y como explican desde la compañía, Sora utiliza una arquitectura de transformadores, igual que los modelos GPT, lo que le proporciona un rendimiento de escalado superior.

Sin embargo, Sora presenta limitaciones en cuanto a la duración de sus vídeos, ya que solo genera vídeos con una duración máxima de un minuto.

Sora, una IA «casi» perfecta

Pese a que las demostraciones de Sora que sus creadores han publicado en los últimos días han dejado a todo el mundo boquiabierto, todavía tienen que pulir algunos detalles. Los de OpenAI aseguran que su herramienta presenta algunas debilidades (casi insignificantes si tenemos en cuenta su enorme potencial). Por ejemplo, aún están en proceso de perfeccionar las interacciones complejas entre los objetos y las personas. Aprender sobre los efectos de la interacción de los humanos con los diferentes objetos sería uno de los aspectos a mejorar de Sora. Además, también puede confundir detalles determinantes como las indicaciones izquierda y derecha.

No obstante, sus creadores han confirmado que están enseñando a la IA a simular y a comprender el mundo físico en movimiento. Por lo tanto, y teniendo en cuenta las primeras demostraciones, parece que cada vez será más difícil diferenciar lo real de lo creado con IA.

Al mismo tiempo, la compañía tecnológica trata de solventar otros asuntos relacionados con la seguridad de su uso. En ese sentido, un clasificador de texto comprobará y rechazará aquellas entradas de texto que soliciten violencia extrema, contenido sexual, imágenes que inciten al odio, o que incluyan imágenes de famosos o la propiedad intelectual de terceros.

Alternativas a Sora

A finales de enero, Google presentó Lumiere, una herramienta que definieron como un modelo de difusión espacio-temporal para la generación de vídeo. Este generador de vídeos con inteligencia artificial prometía ser el más avanzado del mercado, hasta que apareció Sora. Sus vídeos tienen buena calidad y ofrecen múltiples opciones de creación, pero su duración está limitada a 5 segundos. La herramienta puede generar vídeos a partir de texto, pero también animar imágenes y alterar o completar vídeos ya existentes.

 

11
3
7
Publi cuadricula 250 x250 PC (2)
Publi cuadricula 250 x250 PC (3)
Publi cuadricula 250 x250 PC (2)
Publi cuadricula 250 x250 PC (3)
Publi cuadricula 250 x250 PC (2)
Publi cuadricula 250 x250 PC (3)
1
Publicidad pie de web PC 1200 x 300
Publicidad pie de web PC 1200 x 300 (2)

NOTAS RELACIONADAS

Que gramaje de papel elegir para Impresiones

Poner el precio correcto a la impresion

Es suficiente CMYK en una impresora de Gran Formato

Tendencias en diseño de envases -2° parte

Tendencias en diseño de Envases 1° parte

La inteligencia artificial y la impresión 3D

Cortar telas con una cortadora láser

El Eco tintado en piezas gráficas

Solución de problemas comunes del bordados

Tendencias de la industria de la serigrafía para 2024

Que gramaje de papel elegir para Impresiones

Poner el precio correcto a la impresion

Es suficiente CMYK en una impresora de Gran Formato

Tendencias en diseño de envases -2° parte

Tendencias en diseño de Envases 1° parte

La inteligencia artificial y la impresión 3D

Cortar telas con una cortadora láser

El Eco tintado en piezas gráficas

Solución de problemas comunes del bordados

Tendencias de la industria de la serigrafía para 2024