Na última semana, a OpenAI apresentou o GPT-4o, uma evolução do modelo que atualmente alimenta seu robô conversacional, o ChatGPT. O modelo é capaz de processar textos, imagens e áudios em tempo real e tem uma maior capacidade de compreensão em comparação com seu antecessor.
A novidade da startup rapidamente se tornou viral na internet e, nas redes sociais, muitos usuários compararam a voz escolhida para as interações com a da atriz Scarlett Johansson no premiado filme “Ela”, de 2013. No filme, o escritor Theodore se apaixona pela voz de um sistema operacional chamado Samantha.
A grande novidade apresentada nesta semana é que o GPT-4o é muito mais responsivo e capaz de responder às interações com humanos de forma mais natural e dinâmica, além de “falar” com diferentes tipos de entonação e expressar nuances conversacionais impossíveis anteriormente.
Todas essas novas capacidades realmente lembram o filme, que até foi referenciado pelo CEO da OpenAI em uma publicação bem humorada no X/Twitter. Agora, após esclarecer publicamente que a opção de voz não é uma imitação da interpretação de Johansson, ela foi removida do ar.
Os usuários ainda podem escolher entre outras opções para interações por voz, mas a alternativa popular na internet na última semana foi removida definitivamente. Isso ocorre em meio a pressões de profissionais da indústria do entretenimento que temem a utilização de vozes de IA para dublagem em produções para TV e cinema, devido ao custo menor. A OpenAI afirmou que uma atriz trabalhou para interpretar “Sky”, porém sua identidade não foi revelada por questões de segurança.
Atualmente, a empresa enfrenta processos judiciais por supostas violações de direitos autorais, incluindo uma batalha contra o jornal The New York Times, que alega uso não autorizado de seus textos para treinamento.