TECNOLOGÍA: OpenAI presenta "Sora", un modelo que transforma texto en video
EFE:
Washington. - La empresa OpenAI, uno de los líderes en inteligencia artificial generativa,
presentó este jueves su modelo 'Sora' que acepta instrucciones en texto y las
convierte en escenas de video, realistas, con múltiples caracteres y
movimientos específicos.
Según la
firma, establecida en 2015 y dirigida por Sam Altman, que ha desarrollado
ChatGPT y el generador de imágenes fijas DALL-E, 'Sora' es capaz de crear
"escenas complejas con detalles del componente principal y el
trasfondo".
La compañía
también indicó que su modelo puede "entender cómo existen los objetos en
el mundo físico" y tiene la capacidad de "interpretar
acertadamente las instrucciones y de generar caracteres convincentes que
expresan emociones vibrantes".
'Sora' es el
término en japones para "cielo" y la compañía todavía no la ha puesto
a disposición del público porque sigue analizándola para comprender los
peligros del sistema, según indicó el diario The New York Times.
En cambio,
OpenAI ha compartido la tecnología con un pequeño grupo de académicos y otros
investigadores externos cuya tarea es detectar las maneras en las cuales 'Sora'
podría usarse con fines maliciosos.
Steven Levy,
de la revista Wired, describió su experiencia cuando OpenAi le permitió ver,
aunque no operar, el modelo 'Sora' en respuesta a la instrucción en texto para
crear una escena de la ciudad de Tokio captada por una cámara que se mueve por
las calles, sigue a algunas personas en un día con nieve.
"El
resultado es una vista convincente de lo que es, sin duda, Tokio en ese
momento, cuando coexisten los copos de nieve y los capullos de cerezos" escribió Levy. "La cámara virtual, colocada en un robot
volador (dron), sigue a una pareja que camina por el paisaje".
La firma
indica que 'Sora' permite la creación de muchos mundos, con escenas realistas o
fantásticas, tridimensionales, con movimientos fluidos, y aun en las escenas
que no existen en el mundo real, el modelo aplica las reglas físicas correctas.
De este modo, OpenAI, que revolucionó el emergente sector de los servicios de IA regenerativa, dispondrá de un conjunto de servicios que van desde la generación de texto, imagen estática y video.
No hay comentarios