Revolución de OpenAI: lanza Sora que permite crear vídeos de 60 segundos con instrucciones de texto
Lo último de OpenAI en materia de inteligencia artificial se llama Sora y permite crear vídeos de hasta 60 segundos de una calidad impresionante mediante comandos de textos. Una herramienta que posee un potencial increíble.
Siguiendo el camino marcado por ChatGPT y su continua evolución, OpenAI se desmarca con una aplicación que estamos convencidos de que va a suponer una revolución total.
Una nueva evolución en materia IA global
Según palabras de la propia web de Sora, "Estamos enseñando a la IA a comprender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción con el mundo real".
Una declaración de intenciones que está avanzando a pasos agigantados y que, como puedes ver en el enlace que dejamos abajo si echas un vistazo a los vídeos de muestra que están alojados en el site, los resultados son como poco llamativos.
De momento, Sora sólo está en fase de pruebas, si bien OpenAI está dando acceso a esta herramienta a varios artistas visuales, diseñadores y cineastas para obtener feedback que ayude a la compañía a avanzar en este nuevo rumbo.
Este software avanzado tiene la capacidad de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y seguimiento por parte de la cámara y detalles muy precisos para el protagonista y el escenario en el que se encuentra.
Pero no sólo eso, dado que Sora es capaz de interpretar todos estos elementos dentro de un entorno real, es decir, aplicando todas las físicas y reglas naturales existentes en la realidad.
Por otra parte, esta nueva aplicación también puede desarrollar múltiples tomas dentro de cada vídeo que haya generado, manteniendo inalterables por supuesto cada uno de sus elementos y su estilo visual.
Otra cualidad de esta IA es su profundo conocimiento del lenguaje (aunque el número de idiomas que maneja está sin confirmar), lo que le permite interpretar con suma precisión todas las indicaciones o prompts que le demos para crear escenas y personajes convincentes.
También conviene destacar que, aparte de poder generar un vídeo mediante instrucciones de texto, esta nueva IA es capaz de crear una escena a partir de una simple imagen, animando el contenido de la misma a posteriori.
Y de la misma forma, Sora también puede usar como punto de partida un vídeo ya existente y extenderlo, o completar los fotogramas faltantes en una escena parcialmente "rota".
En definitiva, Sora va a ser una herramienta de generación de vídeos muy potente y tiene todo el potencial para convertirse en el futuro de la IA en general.
¿Y en qué se ha basado el desarrollo de Sora? Pues, de entrada, en los modelos ya instaurados de DALL·E y GPT. Por ejemplo, Sora usa la técnica de subtitulación avanzada de DALL·E 3, la cual genera subtítulos muy descriptivos para los datos.
Seguridad ante todo
En cuanto a su utilización, tranquiliza bastante el hecho de que OpenAI está considerando diferentes aspectos relacionados con la seguridad y la utilización que se le dará a Sora.
Dicha compañía está trabajando actualmente con expertos en áreas como desinformación, contenido de odio y prejuicios para ajustar los parámetros de Sora y evitar su uso malintencionado.
Pero OpenAI irá un paso más allá. Sora incluirá las herramientas necesarias para ayudar a detectar contenido desagradable, como un indicador que avise de la creación de un nuevo vídeo de o incluir metadatos de C2PA.
Con esto se pretende que Sora sea capaz de revisar los fotogramas de cada vídeo que haya generado para ayudar a garantizar que se cumplan todas las políticas de uso antes de que dicha obra sea lanzada abiertamente.
Es decir, que la IA podrá rechazar aquellas indicaciones o prompts que infrinjan las normas de uso del software, como aquellas que tengan que ver con violencia extrema, contenido sexual, odio, imágenes de celebridades o VIP, etc.
Pero a pesar de todo lo que os acabamos de comentar, la propia compañía OpenAI ha reconocido que Sora todavía tiene sus problemas y bugs en su estado actual.
El principal por lo que parece es el que tiene que ver con la pauta acción-reacción, y la compañía expone un ejemplo muy gráfico.
En una escena en la que un personaje da un mordisco a una galleta, Sora todavía no es capaz de reconocer la consecuencia que el acto en cuestión acarrea. Y por eso mismo, tras el bocado la galleta es muy probable que no muestre la marca del mordisco.
Junto a esto, la IA también tiende a confundir algunos detalles espaciales de un mensaje, como confundir izquierda y derecha. Y para terminar, también puede tener dificultades con algunas descripciones precisas de escenas que tienen lugar a lo largo del tiempo, como seguir el travelling de una cámara.
Unos problemas que, damos por supuesto, serán completamente eliminados cuando Sora llegue a estar disponible en su versión final, fecha que todavía está por confirmar. Pero si quieres echar un vistazo a lo que es capaz de crear en su estado actual, te recomendamos que eches un vistazo a su página oficial.
OpenAI quiere revolucionar nuevamente el mundo de la IA con Sora y su capacidad de generar vídeos a partir de simples comandos. Un nombre que, como mero apunte friky final, es el mismo del protagonista principal de la saga JRPG de Square-Enix llamada Kingdom Hearts.
ChatGPT sigue evolucionando: la IA tendrá memoria
Web: Sora
- Ver Comentarios