A Microsoft revelou sua mais recente ferramenta de inteligência artificial, o VASA-1. Essa ferramenta é capaz de transformar imagens estáticas de rostos humanos em clipes animados, com alta resolução e até 40 quadros por segundo. O VASA-1 processa as imagens e um áudio de pelo menos um minuto para criar vídeos com sincronização labial precisa e reprodução fiel de microexpressões faciais.
Além de trabalhar com fotos reais, o VASA-1 pode dar vida a representações artísticas de figuras humanas, como desenhos ou obras de arte. Um exemplo famoso mostra a Mona Lisa cantando rap.
Apesar do interesse gerado, a Microsoft não pretende disponibilizar o VASA-1 ao público, mantendo seu uso apenas para pesquisa. A empresa demonstra preocupações quanto aos possíveis impactos negativos, reconhecendo que a ferramenta poderia ser mal utilizada para gerar vídeos falsos que causariam danos reais. Essa postura segue a linha da OpenAI com o Sora, que busca aplicações benéficas da inteligência artificial.