Voice Engine novo modelo da OpenAI consegue clonar vozes humanas

Recentemente, foi apresentada pela OpenAI a sua mais nova ferramenta de inteligência artificial, o Voice Engine. Este novo modelo de IA tem a capacidade de copiar e reproduzir vozes humanas com alta fidelidade a partir de clipes de até 15 segundos, porém sua disponibilidade ainda é limitada.

Assim como aconteceu com o modelo de geração de vídeos baseado em prompts de texto, Sora, a OpenAI está restringindo o acesso ao Voice Engine. A empresa considera que seu uso inadequado pode trazer prejuízos à sociedade, como disseminação de desinformação e possíveis golpes.

Em um comunicado, a startup destacou possíveis implicações da ferramenta, como as eleições que estão acontecendo nos EUA, Brasil e em outros lugares do mundo. Por isso, a OpenAI está colaborando com entidades governamentais, de mídia, entretenimento, educação e sociedade civil para avaliar as possíveis ameaças antes de disponibilizar o serviço de forma mais ampla.

Sobre as aplicações do Voice Engine, a OpenAI mencionou que poderia ser benéfico para a tradução automática de conteúdos em vídeo em plataformas online. Isso permitiria que criadores utilizassem sua própria voz em traduções para outros idiomas, alcançando assim novos públicos.

Além disso, a empresa sugeriu a utilização do Voice Engine para auxiliar pacientes com problemas de fala ou que tenham perdido a voz, possibilitando uma comunicação mais eficiente.

Entidades que oferecem ajuda humanitária também poderiam se beneficiar dessa ferramenta, conseguindo se conectar de forma mais profunda com as comunidades atendidas.

A OpenAI informou que o Voice Engine foi finalizado no final de 2022 e que desde então vem realizando testes com poucos parceiros confiáveis. Até o momento, não há previsão de quando a empresa disponibilizará o Voice Engine para uso mais amplo, visto os potenciais riscos que ele pode apresentar para a sociedade.