Recentemente, foi apresentada pela OpenAI a sua mais nova ferramenta de inteligência artificial, o Voice Engine. Este novo modelo de IA tem a capacidade de copiar e reproduzir vozes humanas com alta fidelidade a partir de clipes de até 15 segundos, porém sua disponibilidade ainda é limitada.
Assim como aconteceu com o modelo de geração de vídeos baseado em prompts de texto, Sora, a OpenAI está restringindo o acesso ao Voice Engine. A empresa considera que seu uso inadequado pode trazer prejuízos à sociedade, como disseminação de desinformação e possíveis golpes.
Em um comunicado, a startup destacou possíveis implicações da ferramenta, como as eleições que estão acontecendo nos EUA, Brasil e em outros lugares do mundo. Por isso, a OpenAI está colaborando com entidades governamentais, de mídia, entretenimento, educação e sociedade civil para avaliar as possíveis ameaças antes de disponibilizar o serviço de forma mais ampla.
Sobre as aplicações do Voice Engine, a OpenAI mencionou que poderia ser benéfico para a tradução automática de conteúdos em vídeo em plataformas online. Isso permitiria que criadores utilizassem sua própria voz em traduções para outros idiomas, alcançando assim novos públicos.
Além disso, a empresa sugeriu a utilização do Voice Engine para auxiliar pacientes com problemas de fala ou que tenham perdido a voz, possibilitando uma comunicação mais eficiente.
Entidades que oferecem ajuda humanitária também poderiam se beneficiar dessa ferramenta, conseguindo se conectar de forma mais profunda com as comunidades atendidas.
A OpenAI informou que o Voice Engine foi finalizado no final de 2022 e que desde então vem realizando testes com poucos parceiros confiáveis. Até o momento, não há previsão de quando a empresa disponibilizará o Voice Engine para uso mais amplo, visto os potenciais riscos que ele pode apresentar para a sociedade.