A Microsoft lançou recentemente o VASA-1, uma nova ferramenta de inteligência artificial capaz de transformar imagens estáticas em vídeos curtos. O modelo utiliza tecnologia deepfake e consegue sincronizar os lábios com o áudio, reproduzindo expressões faciais realistas. Além de pessoas reais, a IA também pode gerar vídeos de representações artísticas, como uma animação da Mona Lisa cantando rap.
A empresa não pretende disponibilizar a ferramenta para o público em geral devido ao impacto negativo que seu uso indevido poderia ter. No entanto, planeja incorporar a tecnologia em seus serviços, como no Microsoft Teams, possibilitando videochamadas com animações de perfil.
O Teams já permite o uso de avatares em videoconferências, mas com o VASA-1 a Microsoft poderia levar essa funcionalidade a um novo nível, utilizando imagens reais de pessoas nas representações. A empresa busca melhorar as representações de humanos do VASA para reproduzir nuances de expressões faciais e movimentações corporais de forma mais realista.