Apple lanza un prototipo de herramienta de inteligencia artificial que anima imágenes basándose en descripciones de texto
Los investigadores internos de Apple han presentado Keyframer, un prototipo de herramienta de animación generativa de inteligencia artificial que permite añadir movimiento a imágenes 2D describiendo cómo deben animarse.
En un documento de investigación, Apple afirma que los grandes modelos lingüísticos (LLM) están “poco investigados” para la animación, a pesar del potencial que han demostrado en otros medios creativos como la escritura y la generación de imágenes. La herramienta Keyframer basada en LLM se presenta como uno de los ejemplos de aplicación de la tecnología, informa The Verge.
Utilizando GPT4 de OpenAI como modelo base, Keyframer puede aceptar archivos de gráficos vectoriales escalables (SVG) -un formato de ilustración que puede modificarse sin comprometer la calidad- y generar código CSS para animar imágenes basándose en señales textuales. El usuario carga una imagen, introduce un texto del tipo “que centelleen las estrellas” y pulsa el botón Generar. Los ejemplos del estudio muestran cómo la ilustración de Saturno puede cambiar a distintos fondos o mostrar estrellas que desaparecen y aparecen en primer plano.
Los usuarios pueden crear varios diseños de animación en un solo paquete y personalizar propiedades como los códigos de color y la duración de la animación. No se requiere experiencia en codificación, ya que Keyframer convierte automáticamente estos cambios a CSS, aunque el código en sí es totalmente editable.
Sin embargo, aún queda mucho camino por recorrer. Keyframer aún no está a disposición del público, y en el estudio de usuarios para el documento de investigación de Apple sólo participaron 13 personas que sólo pudieron utilizar dos imágenes SVG sencillas preseleccionadas al experimentar con la herramienta.
Apple también tiene cuidado de mencionar sus limitaciones, señalando que Keyframer se centra en animaciones web como secuencias de carga, visualizaciones de datos y transiciones animadas. En cambio, la animación que se ve en películas y videojuegos es demasiado compleja para crearla sólo con descripciones, al menos de momento.