A Nvidia-backed Startup Just Unveiled AI Avatars That Can Express Human Emotions

Uma startup de IA apoiada pela Nvidia apresentou sua próxima geração de avatares de IA que podem entender o contexto a partir de entradas de texto e expressar emoções humanas, como felicidade, tristeza e excitação.

A Synthesia, uma empresa sediada em Londres, disse que sua quarta geração de “Avatares Expressivos” é alimentada por um modelo treinado “para entender a relação intricada entre o que dizemos e como dizemos”. Os avatares podem seguir roteiros como atores reais usando o tom de voz correto, linguagem corporal e sincronização labial, afirmou a empresa.

“Com esses novos avatares, não estamos apenas criando renderizações digitais; estamos introduzindo atores digitais”, escreveu a Synthesia em um post de blog. “Essa tecnologia traz um nível de sofisticação e realismo aos avatares digitais que borra a linha entre o virtual e o real.” Os avatares são alimentados pelo modelo EXPRESS-1 da Synthesia, que é treinado para prever movimentos (como piscar) e expressões faciais (como sorrir) para combinar com o tom do avatar, resultando em interações mais humanas.

A empresa, fundada em 2017 por uma equipe de pesquisadores de IA e empreendedores, concentra-se na produção de vídeo sem câmeras, microfones ou estúdios. Os avatares da Synthesia têm sido usados por empresas para fazer apresentações e vídeos de treinamento, afirmou.

A Synthesia disse que determinados tipos de conteúdo serão restritos para evitar o mau uso por atores de má fé, especialmente em meio às próximas eleições presidenciais nos EUA. Em outro post de blog, a Synthesia destacou como a IA tem sido usada para espalhar desinformação e como seus avatares especificamente podem ser usados para se assemelhar à voz e semelhança de uma pessoa real.

Os 225 avatares existentes da empresa foram usados por mais de 200.000 pessoas para gerar mais de 18 milhões de apresentações em vídeo em mais de 130 idiomas, afirmou. A Synthesia também atende a mais de 55.000 empresas em todo o mundo, incluindo metade das empresas Fortune 100.

Em junho passado, a Synthesia anunciou que havia levantado US$ 90 milhões em uma rodada de financiamento série C que incluiu o líder em chips Nvidia. A rodada, que levou a empresa a uma avaliação de US$ 1 bilhão, foi liderada pela empresa de capital de risco Accel, que também foi investidora no Facebook e Spotify.

“A produtividade pode ser melhorada porque você está reduzindo o custo de produção do vídeo ao custo de fazer um PowerPoint”, disse Philippe Botteri, um investidor da Accel, à CNBC em junho. “O vídeo é uma maneira muito melhor de comunicar conhecimento. Quando pensamos sobre o potencial da empresa e da valuation, pensamos no que ela pode retornar, e no caso da Synthesia, estamos apenas arranhando a superfície.”