Nova IA da Microsoft cria vídeos realistas a partir de imagens – confira

A Microsoft revelou sua mais recente ferramenta de inteligência artificial, o VASA-1. Ele pode transformar imagens estáticas de rostos humanos em clipes animados, com resolução de 512 x 512 pixels e até 40 quadros por segundo.

O modelo processa a imagem e um clipe de áudio de pelo menos um minuto, podendo ser um discurso ou uma música, para criar um vídeo que sincroniza os lábios de forma precisa e reproduz as microexpressões faciais de maneira fiel.

Além de fotos reais, o VASA-1 pode dar vida a representações artísticas de figuras humanas, como desenhos ou obras de arte.

Um dos vídeos de demonstração viralizou na internet, mostrando a Mona Lisa de Leonardo da Vinci cantando o rap “Paparazzi” e um meme da atriz Anne Hathaway em um talk show.

A Microsoft não pretende disponibilizar o VASA-1 ao público, apenas usá-lo para fins de pesquisa, citando preocupações com possíveis deepfakes. A empresa reconhece que, se liberar a ferramenta amplamente, não conseguirá controlar seu uso indevido, especialmente na criação de vídeos falsos que possam prejudicar pessoas na vida real.

Essa postura da Microsoft é semelhante à da OpenAI com o Sora, outra ferramenta de geração de vídeos ultrarrealistas que não será disponibilizada a todos, sendo estudadas possíveis aplicações benéficas para a humanidade.