Apple ha anunciado una nueva e innovadora herramienta de inteligencia artificial que podría permitir a cualquiera crear animaciones. Apple Keyframer es un generador de animaciones de IA que no necesita nada más que una imagen fija y una instrucción de texto.
Casualmente, llega apenas unos días después de que la compañía revelara MGIE, una forma de editar fotografías mediante comandos de texto.
Apple Keyframer: una herramienta de animación con IA
Solo unos días después, VentureBeat descubrió que los investigadores de Apple habían publicado otro artículo sobre la manipulación de gráficos mediante comandos de texto. Apple Keyframe es una herramienta de animación de IA que permite a los usuarios coger una sola imagen y luego usar texto en lenguaje natural para indicarle al sistema cómo animarla.
Puedes, por ejemplo, tomar una imagen estática del planeta Saturno y dar la orden «Haz girar el planeta«.
También puedes usarlo para ayudar a generar ideas. Por ejemplo, un gráfico que contenga estrellas y el comando «Crea tres diseños donde las estrellas titilen».
El documento de investigación considera que su mercado objetivo inicial son los profesionales gráficos, que lo utilizarían para probar rápidamente ideas antes de trabajar en ellas de forma convencional.
Basado en entrevistas con diseñadores e ingenieros de animación profesionales, Keyframer apoya la exploración y el refinamiento de las animaciones mediante la combinación de indicaciones y edición directa de la salida generada. El sistema también permite a los usuarios solicitar variantes de diseño, lo que respalda la comparación y la ideación.
Apple dice que Keyframer es más poderoso que las herramientas existentes que apuntan a hacer lo mismo, porque es posible refinar ideas, ya sea usando más indicaciones de texto o editando manualmente el código CSS generado por el sistema de inteligencia artificial.
Los investigadores, están creando nuevas vías de creatividad y de inspiración:
A través de este trabajo, esperamos inspirar futuras herramientas de diseño de animación que combinen las poderosas capacidades generativas de los LLM para acelerar la creación de prototipos de diseño con editores dinámicos que permitan a los creadores mantener el control creativo.
Cómo funciona Apple Keyframer
Keyframer funciona con un modelo de lenguaje grande o también denominado LLM (en el estudio han usado GPT-4) que puede generar código de animación CSS a partir de una imagen SVG estática y un mensaje. «Los grandes modelos de lenguaje tienen el potencial de impactar una amplia gama de dominios creativos, pero la aplicación de los LLM (grandes modelos de lenguaje) a la animación está poco explorada y presenta desafíos novedosos, como por ejemplo cómo los usuarios pueden describir efectivamente el movimiento en lenguaje natural«, explican los investigadores.
¿Qué son los Modelos de lenguaje grande (LLM)? son modelos de aprendizaje automático que pueden comprender y generar un texto en lenguaje humano. Funcionan al analizar conjuntos de datos masivos del lenguaje.
Algunos ejemplos de LLM del mundo real incluyen ChatGPT (de OpenAI), Bard (Google), Llama (Meta), Bing Chat (Microsoft) o Copilot de GitHub.
Para crear una animación, un usuario carga una imagen SVG, escribe un mensaje de texto como «Haz que las nubes se desplacen lentamente hacia la izquierda» y Keyframer generará el código para que se realice esa animación. Luego, los usuarios pueden refinar la animación editando el código CSS directamente o agregando nuevas indicaciones en lenguaje natural.
Según el artículo, «Keyframer apoya la exploración y el refinamiento de animaciones mediante la combinación de indicaciones y edición directa de la salida generada«. Este enfoque centrado en el usuario se basó en varias entrevistas con diseñadores e ingenieros de animación profesionales que brindaron comentarios sobre la herramienta de investigación, y todos enfatizaron el diseño iterativo y la creatividad.
«Creo que esto fue mucho más rápido que muchas de las cosas que he hecho… Creo que hacer algo como esto antes simplemente habría tomado horas«, dijo un participante del estudio entrevistado para el artículo.