A OpenAI estreou na segunda-feira um novo chatbot com algumas capacidades impressionantes – ou assustadoras, dependendo da perspectiva. Com sua capacidade de ver, ouvir e falar como uma pessoa real, os executivos da OpenAI demonstraram como o ChatGPT mais recente pode traduzir conversas ao vivo e contar histórias para dormir em vozes diferentes.
O chefe de pesquisa de fronteiras da OpenAI, Mark Chen, pediu ao chatbot que contasse “uma história para dormir sobre robôs e amor”.
“Oh, uma história para dormir sobre robôs e amor? Eu cobri você!” respondeu imediatamente uma voz feminina entusiasmada. “Era uma vez, em um mundo não muito diferente do nosso, havia um robô chamado Byte. Byte era um robô curioso. Sempre explorando.”
Chen interrompeu, “Eu quero um pouco mais de emoção na sua voz, um pouco mais de drama.”
“Entendi. Vamos adicionar um pouco de drama”, disse o ChatGPT-4o, começando sua história novamente, mas desta vez com uma voz mais profunda e intrigante.
Chen interviu mais uma vez, “Não, não, não, ChatGPT, eu realmente quero emoção máxima, como expressividade máxima, muito mais do que você estava fazendo antes.”
“Entendi. Vamos amplificar o drama”, respondeu, repetindo novamente sua linha de abertura com uma voz muito mais alta e ainda mais dramática. A chefe de tecnologia da OpenAI, Mira Murati, pediu ao chatbot que mudasse para a história com uma voz de robô; ele obedeceu. Em seguida, o colega pesquisador Barret Zoph interveio, pedindo uma voz de cantiga. O ChatGPT suspirou e começou a cantar.
Murati, Chen e Zoph mostraram como o ChatGPT-4o pode traduzir uma conversa ao vivo entre italiano e francês e como pode ouvir você respirar e guiá-lo através de exercícios de respiração. O chatbot é duas vezes mais rápido do que o GPT-4 turbo e está disponível para usuários gratuitos.
“Nos últimos anos, estivemos muito focados em melhorar a inteligência desses modelos, e eles melhoraram bastante”, disse Murati. “Mas esta é a primeira vez que realmente estamos dando um grande passo adiante quando se trata da facilidade de uso.”
Talvez ainda mais impressionante do que suas habilidades de conversação em tempo real sejam as capacidades visuais do ChatGPT. O chatbot pode olhar para o rosto de alguém através de uma câmera de telefone e dizer a ela como acha que ela está se sentindo pelas expressões faciais. Ele pode olhar para a tela do computador de um usuário por meio de compartilhamento de tela e ajudar a resolver um problema de matemática.
Preocupações com a segurança
Murati disse que as capacidades do chatbot, embora uma grande melhoria, representam “novos desafios para nós em termos de segurança”.
“Nossa equipe tem trabalhado duro para descobrir como construir mitigações contra o uso indevido”, disse ela, acrescentando que a OpenAI está trabalhando com governos e empresas em “todas as indústrias” para alcançar seus objetivos. Ela não deu detalhes sobre as preocupações de segurança, o plano da OpenAI ou a natureza de suas parcerias.