ChatGPT da OpenAI pode contar histórias de ninar e resolver problemas de matemática

A OpenAI estreou na segunda-feira um novo chatbot com algumas capacidades impressionantes – ou assustadoras, dependendo da perspectiva. Com sua habilidade de ver, ouvir e falar como uma pessoa real, os executivos da OpenAI demonstraram como o ChatGPT mais recente pode traduzir conversas ao vivo e contar histórias para dormir em vozes diferentes.

O chefe de pesquisa da OpenAI, Mark Chen, pediu ao chatbot para contar “uma história para dormir sobre robôs e amor”.

“Oh, uma história para dormir sobre robôs e amor? Eu estou coberto!” respondeu imediatamente uma entusiasmada voz feminina. “Era uma vez, em um mundo não muito diferente do nosso, havia um robô chamado Byte. Byte era um robô curioso. Sempre explorando.”

Chen interrompeu, “Eu quero um pouco mais de emoção na sua voz, um pouco mais de drama.”

“Entendido. Vamos adicionar um pouco de drama,” disse ChatGPT-4o, começando a contar a história novamente, mas desta vez em uma voz mais profunda com mais intriga.

Chen interveio mais uma vez, “Não, não, não, ChatGPT, eu quero realmente uma emoção máxima, como máximo de expressividade, muito mais do que você estava fazendo antes.”

“Entendido. Vamos amplificar o drama,” respondeu, repetindo sua linha de abertura em uma voz muito mais alta, ainda mais dramática. O chefe de tecnologia da OpenAI, Mira Murati, pediu ao chatbot para mudar para a história em uma voz de robô; ele obedeceu. Então o colega pesquisador Barret Zoph interveio, pedindo uma voz de canto. ChatGPT suspirou e começou a cantar.

Murati, Chen e Zoph mostraram como o ChatGPT-4o pode traduzir uma conversa ao vivo entre italiano e francês e como pode ouvir você respirar e guiá-lo durante exercícios de respiração. O chatbot é duas vezes mais rápido que o GPT-4 turbo e está disponível para usuários gratuitos.

“Nos últimos dois anos, nós estivemos muito focados em melhorar a inteligência desses modelos, e eles ficaram muito bons,” disse Murati. “Mas esta é a primeira vez que estamos realmente dando um grande passo à frente quando se trata de facilidade de uso.”

Talvez ainda mais impressionantes do que suas habilidades de conversação em tempo real são as capacidades visuais do ChatGPT. O chatbot pode olhar para o rosto de alguém através da câmera do telefone e dizer a ele como acha que está se sentindo pelas expressões faciais. Ele pode olhar para a tela do computador de um usuário através do compartilhamento de tela e ajudar a resolver um problema de matemática.

Preocupações com segurança

Murati disse que as capacidades do chatbot, embora uma grande melhoria, levantam “novos desafios para nós no que diz respeito à segurança.”

“Nossa equipe tem trabalhado duro para descobrir como construir mitigadores contra o uso indevido,” disse ela, acrescentando que a OpenAI está trabalhando com governos e empresas em “todas as indústrias” para alcançar seus objetivos. Ela não deu detalhes sobre preocupações de segurança, o plano da OpenAI ou a natureza de suas parcerias.