Novo ChatGPT da OpenAI pode contar histórias de dormir e resolver problemas de matemática

A OpenAI estreou na segunda-feira um novo chatbot com algumas capacidades impressionantes – ou assustadoras, dependendo da perspectiva. Com sua capacidade de ver, ouvir e falar como uma pessoa real, os executivos da OpenAI demonstraram como o ChatGPT mais recente pode traduzir conversas ao vivo e contar histórias de ninar em vozes diferentes. O chefe de pesquisa de fronteiras da OpenAI, Mark Chen, pediu ao chatbot para contar “uma história de ninar sobre robôs e amor”. “Oh, uma história de ninar sobre robôs e amor? Eu tenho para você!” respondeu imediatamente uma voz feminina entusiasmada. “Era uma vez, em um mundo não muito diferente do nosso, havia um robô chamado Byte. Byte era um robô curioso. Sempre explorando.” Chen interrompeu, “Quero um pouco mais de emoção em sua voz, um pouco mais de drama.” “Entendi. Vamos adicionar um pouco de drama,” disse o ChatGPT-4o, começando a história novamente, mas desta vez em uma voz mais profunda com mais intriga. Chen interveio uma vez mais, “Não, não, não, ChatGPT, eu quero realmente uma emoção máxima, como uma expressividade máxima, muito mais do que você estava fazendo antes.” “Entendido. Vamos amplificar o drama,” respondeu, repetindo novamente sua linha de abertura com uma voz muito mais alta, ainda mais dramática. A chefe de tecnologia da OpenAI, Mira Murati, pediu ao chatbot que mudasse a história para uma voz de robô; ele obedeceu. Em seguida, o colega pesquisador Barret Zoph interveio, pedindo uma voz cantante. O ChatGPT suspirou e começou a cantar. Murati, Chen e Zoph mostraram como o ChatGPT-4o pode traduzir uma conversa ao vivo entre italiano e francês e como pode ouvir sua respiração e orientá-lo em exercícios de respiração. O chatbot é duas vezes mais rápido que o GPT-4 turbo e está disponível para usuários gratuitos. “Nos últimos anos, temos estado muito focados em melhorar a inteligência desses modelos, e eles ficaram muito bons”, disse Murati. “Mas esta é a primeira vez que estamos realmente dando um grande passo em frente quando se trata de facilidade de uso.” Talvez ainda mais impressionantes do que suas habilidades de conversação em tempo real sejam as capacidades visuais do ChatGPT. O chatbot pode olhar para o rosto de alguém através da câmera do telefone e dizer como acha que a pessoa está se sentindo pelas expressões faciais. Ele pode olhar para a tela do computador de um usuário através do compartilhamento de tela e ajudar a resolver um problema matemático. Preocupações de segurança Murati disse que as capacidades do chatbot, embora sejam uma grande melhoria, representam “novos desafios para nós quando se trata de segurança”. “Nossa equipe vem trabalhando duro para descobrir como criar mitigadores contra uso indevido”, disse, acrescentando que a OpenAI está trabalhando com governos e empresas em “todas as indústrias” para alcançar seus objetivos. Ela não deu detalhes sobre preocupações de segurança, plano da OpenAI ou a natureza de suas parcerias.