Na semana passada, a OpenAI revelou o GPT-4o, uma versão aprimorada do modelo que está por trás do seu robô de conversação, o ChatGPT. Esse modelo consegue processar textos, imagens e áudios em tempo real, além de ter uma maior capacidade de compreensão se comparado ao seu antecessor.
O lançamento da startup rapidamente se tornou viral na internet e muitos usuários nas redes sociais compararam a voz escolhida para as interações com a da atriz Scarlett Johansson no filme “Ela” de 2013. No filme, o personagem Theodore, interpretado por Joaquin Phoenix, se apaixona pela voz de um sistema operacional chamado Samantha.
A principal inovação apresentada é que o GPT-4o é muito mais responsivo e capaz de responder de forma mais natural e dinâmica às interações com humanos, podendo falar com diferentes entonações e expressar nuances conversacionais impossíveis anteriormente.
Essas novas capacidades realmente lembram o filme, que foi referenciado pelo CEO da OpenAI, Sam Altman, em uma postagem bem-humorada no X/Twitter. Após um esclarecimento público de que a voz chamada “Sky” não era uma imitação da interpretação de Johansson, essa opção foi totalmente retirada do ar.
Os usuários ainda têm outras opções de vozes para suas interações, mas a que ficou famosa recentemente foi removida permanentemente.
Este cenário ocorre em meio a pressões dos profissionais da indústria do entretenimento, os quais temem o uso de vozes de IA para dublagens em produções televisivas e cinematográficas devido ao menor custo. A OpenAI afirmou em um comunicado que uma atriz trabalhou para interpretar a voz “Sky”, mas sua identidade não foi revelada por questões de segurança.
Atualmente, a empresa enfrenta processos judiciais por supostas violações de direitos autorais, que ainda estão longe de ser resolvidos. Uma das batalhas legais mais conhecidas é contra o jornal americano The New York Times, que alega ter tido seus textos usados no treinamento sem consentimento.