Voice Engine: Novo Modelo Da OpenAI Consegue Clonar Vozes Humanas

Recentemente, a OpenAI lançou uma nova ferramenta de inteligência artificial chamada Voice Engine. Essa nova IA é capaz de reproduzir vozes humanas com alta fidelidade a partir de clipes de até 15 segundos. No entanto, sua disponibilidade ainda é limitada.

Assim como fez com o modelo de geração de vídeos baseado em prompts de texto, Sora, a OpenAI está restringindo o acesso ao Voice Engine. Isso porque a empresa considera que seu uso inadequado pode causar danos à sociedade, como a disseminação de desinformação e a ocorrência de golpes.

Em comunicado, a startup destaca as potenciais implicações da ferramenta, especialmente em relação às eleições que acontecerão este ano em diversos países. Por isso, a OpenAI está trabalhando com entidades governamentais, de mídia, entretenimento, educação e sociedade civil para compreender as possíveis ameaças antes de disponibilizar o serviço de forma mais abrangente.

A OpenAI destaca que o Voice Engine pode ser útil para tradução automática de conteúdos em vídeo em plataformas online. Os criadores poderão usar a própria voz nas traduções para outros idiomas, alcançando assim novos públicos. Além disso, a empresa sugere que a ferramenta possa ajudar pacientes com problemas de fala ou que perderam a capacidade de se comunicar, proporcionando uma forma mais eficiente de expressão.

A empresa informa que o Voice Engine está pronto desde o final de 2022, porém, vem realizando testes com alguns poucos parceiros confiáveis. Até o momento, não há uma previsão para a disponibilização ampla da ferramenta, pois há preocupações quanto aos potenciais riscos que ela pode representar para a sociedade.