La nueva herramienta de OpenAI que crea vídeos a partir de textos

La guerra en el sector tecnológico espoleado por la inteligencia artificial (IA) no cesa. OpenAI, la empresa creadora de ChatGPT y Dall-E, acaba de presentar el nuevo salto de la IA generativa: una herramienta que crea al instante videos cortos en respuesta a órdenes escritas.

Pero Sora, el nuevo generador de imágenes en movimiento a partir de textos, no es el primero. Google, que acaba de presentar la versión 1.5 de Gemini, Meta y Runway ML son otras de las empresas que cuentan con tecnologías similares.

Pero la alta calidad de los vídeos mostrados por OpenAI asombró a los observadores. Y también ha despertado temores sobre sus implicaciones éticas y sociales. Es lo que sucedió con su herramienta Dall-E, capaz de crear fotos y dibujos de gran calidad a golpe de sencillas indicaciones de texto conocidas como ‘prompts’. En ese sentido, Sora sería la evolución natural de aquella convirtiendo las imágenes fijas en movimiento.

Y la nueva herramienta lo hace realmente bien pese a ser una versión experimental. Aún no está a disposición del público, y OpenAI ha revelado poca información sobre cómo se creó.

‘Sora’ es el término en japones para “cielo” y la compañía todavía no la ha puesto a disposición del público porque sigue analizándola para comprender los peligros del sistema, según indicó el diario The New York Times.

En cambio OpenAI ha compartido la tecnología con un pequeño grupo de académicos y otros investigadores externos cuya tarea es detectar las maneras en las cuales ‘Sora’ podría usarse con fines maliciosos.

Steven Levy, de la revista Wired, describió su experiencia cuando OpenAi le permitió ver, aunque no operar, el modelo ‘Sora’ en respuesta a la instrucción en texto para crear una escena de la ciudad de Tokio captada por una cámara que se mueve por las calles, sigue a algunas personas en un día con nieve.

“El resultado es una vista convincente de lo que es, sin duda, Tokio en ese momento, cuando coexisten los copos de nieve y los capullos de cerezos” escribió Levy. “La cámara virtual, colocada en un robot volador (dron), sigue a una pareja que camina por el paisaje”.

La firma indica que ‘Sora’ permite la creación de muchos mundos, con escenas realistas o fantásticas, tridimensionales, con movimientos fluidos, y aún en las escenas que no existen en el mundo real, el modelo aplica las reglas físicas correctas.

De este modo, OpenAI, que revolucionó el emergente sector de los servicios de IA regenerativa, dispondrá d e un conjunto de servicios que van desde la generación de texto, imagen estática y video.

Conforme a los criterios de

¿Por qué confiar en nosotros?