OpenAI lanza Sora, que creará videos llamativos

En abril, una nueva empresa de Nueva York llamada Runway AI presentó una tecnología que permite a las personas crear videos de una vaca en una fiesta de cumpleaños o de un perro charlando en un teléfono inteligente escribiendo en un cuadro en la pantalla de una computadora.

Los videos de cuatro segundos estaban borrosos, entrecortados, distorsionados e inquietantes. Pero fueron una señal clara de que las tecnologías de inteligencia artificial producirán vídeos cada vez más convincentes en los próximos meses y años.

Diez meses después, OpenAI, una startup de San Francisco, lanzó un sistema similar que generaba vídeos tomados de películas de Hollywood. En una demostración, la cámara capturó imágenes, creadas en minutos, de mamuts lanudos paseando por un prado nevado, un monstruo mirando una vela derritiéndose y una escena callejera de Tokio.

OpenAI, la compañía detrás del chatbot ChatGPT y el generador de imágenes fijas DALL-E, es una de varias compañías que compiten por desarrollar este tipo de generador de video instantáneo, incluidas empresas emergentes como Runway y gigantes tecnológicos como Google y Meta. Facebook e Instagram. Esta tecnología puede acelerar el trabajo de cineastas experimentados y al mismo tiempo reemplazar por completo a los artistas digitales menos experimentados.

Es una forma rápida y económica de crear desinformación en línea, lo que hace aún más difícil saber qué es real en Internet.

«Estoy absolutamente aterrorizado de que este tipo de cosas influyan en una elección reñida», dijo Oren Etzioni, profesor de la Universidad de Washington que se especializa en inteligencia artificial. Es el fundador de True Media, una organización sin fines de lucro que descubre desinformación en línea en campañas políticas.

READ  Los demócratas apoyaron a Biden cuando el informe generó preocupaciones sobre la edad.

OpenAI llama a su nuevo sistema Sora, en honor a la palabra japonesa que significa cielo. El equipo detrás de la tecnología, incluidos los investigadores Tim Brooks y Phil Peebles, eligió el nombre porque «evoca la idea de un potencial creativo ilimitado».

En una entrevista, la compañía aún no ha hecho público a Sora porque todavía está trabajando para comprender los riesgos del sistema. En cambio, OpenAI está compartiendo la tecnología con un pequeño grupo de académicos y otros investigadores externos que la «equiparán», un término que busca formas en que se pueda utilizar indebidamente.

«El objetivo aquí es proporcionar una vista previa de lo que hay en el horizonte para que la gente pueda ver las capacidades de esta tecnología y podamos obtener comentarios», dijo el Dr. Brooks.

OpenAI ya etiqueta videos generados por computadora con una marca de agua que los identifica como generados por IA, pero la compañía reconoce que se pueden eliminar. También pueden ser difíciles de detectar. (El New York Times agregó marcas de agua «Creado por IA» a los videos con esta historia).

Este sistema es un ejemplo de IA generativa, que puede generar instantáneamente texto, imágenes y sonidos. Al igual que otras tecnologías de IA generativa, el sistema de OpenAI aprende analizando datos digitales; en este caso, videos y subtítulos que describen lo que contienen esos videos.

OpenAI se negó a decir de cuántos videos aprendió el sistema o de dónde vinieron, aunque la capacitación incluyó tanto videos disponibles públicamente como videos con licencia de los titulares de derechos de autor. La empresa guarda silencio sobre los datos que utiliza para entrenar sus tecnologías, principalmente porque quiere mantener una ventaja sobre sus competidores, y ha sido demandada varias veces por utilizar material protegido por derechos de autor.

READ  Driggs du Plessis gana por decisión dividida sobre Sean Strickland para ganar el título de peso mediano

(El New York Times demandó a OpenAI y su socio Microsoft en diciembre, alegando infracción de derechos de autor de contenido de noticias relacionado con sistemas de inteligencia artificial).

Sora crea vídeos en respuesta a descripciones breves como «un hermoso mundo hecho en papel de arrecifes de coral llenos de peces coloridos y vida marina». Si bien los videos son interesantes, no siempre son perfectos y pueden contener imágenes extrañas e ilógicas. Por ejemplo, la organización produjo recientemente un video de alguien comiendo una galleta, pero la galleta no era pequeña.

DALL-E, Midjourney y otros generadores de imágenes fijas han mejorado tan rápidamente en los últimos años que ahora producen imágenes que son casi indistinguibles de las fotografías. Esto ha dificultado la detección de información falsa en línea, y muchos artistas digitales se quejan de que les ha dificultado encontrar trabajo.

«Cuando Midjourney se estrenó por primera vez en 2022, todos nos reímos y dijimos: 'Oh, eso se ve genial'», dijo Reed Southon, un artista conceptual cinematográfico de Michigan. «Ahora la gente está perdiendo sus empleos a mitad del viaje».

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *