Videochamada sem aparecer: Microsoft quer levar deepfake ao Teams

A Microsoft lançou recentemente a ferramenta VASA-1, uma nova ferramenta de inteligência artificial capaz de transformar imagens estáticas em vídeos curtos. O modelo utiliza tecnologia deepfake e consegue sincronizar os lábios com um clipe de áudio, além de reproduzir expressões faciais próximas da realidade. A IA é capaz de gerar vídeos de pessoas reais e também de representações artísticas, como no caso da animação da Mona Lisa cantando rap. A Microsoft não pretende disponibilizar a ferramenta ao público geral devido ao impacto negativo que seu uso indevido pode causar na sociedade, mas planeja incorporar a tecnologia em seus serviços.

Uma das aplicações do modelo é no Microsoft Teams, permitindo que os usuários façam videochamadas com a câmera desligada, sendo a imagem de perfil animada pelo VASA e sincronizada com o áudio em tempo real. O Teams já permite o uso de avatares em videoconferências, mas a nova IA poderia levar essa funcionalidade a um novo nível, utilizando a imagem real das pessoas nas representações. A preocupação da Microsoft atualmente é em melhorar as representações de humanos da VASA, buscando reproduzir nuances de expressões faciais e movimentações corporais de forma mais fiel à realidade.