Nova IA da Microsoft cria vídeos realistas a partir de imagens – Confira

A Microsoft revelou sua mais recente ferramenta de inteligência artificial, o VASA-1. Este software tem a capacidade de transformar imagens estáticas de rostos humanos em clipes animados, com uma resolução de 512 x 512 pixels e até 40 quadros por segundo.

O VASA-1 processa a imagem juntamente com um clipe de áudio de pelo menos um minuto, seja um discurso ou uma música, para criar um vídeo que sincroniza precisamente os lábios e reproduz fielmente as microexpressões faciais. Além disso, pode dar vida a representações artísticas de figuras humanas, como desenhos ou obras de arte.

Embora a ferramenta tenha despertado curiosidade, a Microsoft não pretende disponibilizá-la para o público, mantendo-a apenas para fins de pesquisa, devido às preocupações com os possíveis impactos negativos dos deepfakes. A empresa reconhece que, se liberada para um público mais amplo, não seria capaz de controlar o uso indevido da ferramenta, o que poderia resultar na geração de vídeos falsos que causassem prejuízos reais às pessoas.

Essa postura da Microsoft é semelhante à da OpenAI com o Sora, uma ferramenta de geração de vídeos ultrarrealistas com base em comandos de texto, que também não será disponibilizada para todas as pessoas e está sendo estudada juntamente com especialistas em inteligência artificial para gerar benefícios à humanidade.