Uma startup apoiada pela Nvidia acaba de revelar avatares de IA que podem expressar emoções humanas.

Uma startup de inteligência artificial apoiada pela Nvidia apresentou sua próxima geração de avatares de IA que podem entender o contexto de entradas de texto e expressar emoções humanas, como felicidade, tristeza e empolgação.

A empresa londrina Synthesia disse que seus avatares expressivos de quarta geração são alimentados por um modelo treinado “para entender a relação intrincada entre o que dizemos e como dizemos”. Os avatares podem seguir scripts como atores reais, usando o tom de voz correto, linguagem corporal e sincronização labial, afirmou a empresa.

Com esses novos avatares, não estamos apenas criando renderizações digitais; estamos apresentando atores digitais”, escreveu a Synthesia em um post de blog. “Essa tecnologia traz um nível de sofisticação e realismo aos avatares digitais que borram a linha entre o virtual e o real.” Os avatares são alimentados pelo modelo EXPRESS-1 da Synthesia, que é treinado para prever movimentos (como piscar) e expressões faciais (como sorrir) para combinar com o tom do avatar, resultando em interações mais humanas.

A empresa, fundada em 2017 por uma equipe de pesquisadores e empreendedores de IA, concentra-se na produção de vídeo sem câmeras, microfones ou estúdios. Os avatares da Synthesia foram usados por empresas para fazer apresentações e vídeos de treinamento, afirmou a empresa.

A Synthesia disse que certos tipos de conteúdo serão restritos para evitar o uso indevido por atores mal-intencionados, especialmente diante das próximas eleições presidenciais nos EUA. Em outro post de blog, a Synthesia destacou como a IA tem sido usada para espalhar desinformação e como seus avatares especificamente podem ser usados para se assemelhar à voz e semelhança de uma pessoa real.

Os 225 avatares existentes da empresa foram usados por mais de 200.000 pessoas para gerar mais de 18 milhões de apresentações em vídeo em mais de 130 idiomas, afirmou. A Synthesia também atende a mais de 55.000 empresas em todo o mundo, incluindo metade das empresas Fortune 100.

Em junho passado, a Synthesia anunciou que havia levantado US$ 90 milhões em uma rodada de financiamento da Série C que incluía a líder de chips Nvidia. A rodada, que levou a empresa a uma avaliação de US$ 1 bilhão, foi liderada pela empresa Accel, que também foi investidora no Facebook e Spotify.

“A produtividade pode ser melhorada porque você está reduzindo o custo de produção do vídeo ao de fazer um PowerPoint”, disse Philippe Botteri, um investidor da Accel, ao CNBC em junho. “O vídeo é uma maneira muito melhor de comunicar conhecimento. Quando pensamos no potencial da empresa e na avaliação, pensamos no que ela pode retornar e, no caso da Synthesia, estamos apenas arranhando a superfície.”