Um chatbot de inteligência artificial misterioso chamado “gpt2-chatbot” chamou a atenção nesta semana após ficar disponível em um importante site de benchmarking de modelos de linguagem, LMSYS Org. Ninguém sabe de onde ele veio, mas muitos consideram que ele tem aproximadamente as mesmas capacidades do GPT-4 da OpenAI. Isso coloca o gpt2-chatbot em uma classe rara de modelos de IA que apenas alguns desenvolvedores em todo o mundo conseguiram alcançar.
“Ninguém sabe quem o criou ou o que é, mas eu tenho brincado com ele um pouco e ele parece estar no mesmo nível de habilidade aproximado do GPT-4,” disse Ethan Mollick, um professor que pesquisa inteligência artificial na Wharton School da Universidade da Pensilvânia, em um tweet na segunda-feira.
Assim que o gpt2-chatbot estava atingindo o pico de hype, o chatbot desapareceu na tarde de terça-feira. Um aviso na página inicial do site LMSYS diz “gpt2-chatbot está atualmente indisponível.” Um tweet da organização posteriormente confirmou que o chatbot foi tirado do ar “devido ao tráfego inesperadamente alto.” No entanto, a LMSYS diz para “ficarem atentos para seus lançamentos mais amplos.”
Comunidades online de IA ficaram alvoroçadas com o gpt2-chatbot anônimo. Um usuário afirmou que o gpt2-chatbot quase codificou um clone perfeito do jogo mobile Flappy Bird. Outro usuário disse que ele resolveu um problema da Olimpíada Internacional de Matemática em uma tacada. Em longas threads do Reddit, os usuários estão especulando selvagemente sobre as origens do gpt2-chatbot e discutindo se é da OpenAI, Google ou Anthropic. Não há evidências para essas afirmações, mas tweets do CEO da OpenAI, Sam Altman, e de outros executivos apenas acrescentaram lenha à fogueira.
Anteriormente, era possível experimentar o gpt2-chatbot você mesmo no site da LMSYS Org. Ele estava disponível em “Chat Direto” ou “Arena (lado a lado)” no menu suspenso. A LMSYS Org diz em seu blog de políticas que certos desenvolvedores de modelos de IA podem testar modelos anônimos não lançados antes de um lançamento mais amplo. Isso levou muitos a acreditarem que o gpt2-chatbot é um modelo anônimo de um grande desenvolvedor de IA.
“Apenas para esclarecer, seguindo nossa política, nós nos associamos com vários desenvolvedores de modelos para trazer seus novos modelos para nossa plataforma para testes de pré-visualização da comunidade,” disse a LMSYS Org em um tweet na segunda-feira, em resposta a um tópico sobre o gpt2-chatbot. “Esses modelos são estritamente para testes e não serão listados no placar até serem públicos.”
A LMSYS Org e a OpenAI não responderam imediatamente ao pedido de comentário do Gizmodo.
Em testes limitados do Gizmodo, descobriu-se que o gpt2-chatbot tem capacidades semelhantes aos principais modelos de IA da Anthropic e OpenAI. Ele exibiu um comportamento exclusivo para modelos avançados de linguagem grande, raciocinando bem e delineando planos detalhados para tarefas complicadas. Aqui estão alguns de nossos exemplos comparando o gpt2-chatbot (esquerda) e o modelo Claude Opus da Anthropic (direita).
Um professor de engenharia da computação da Universidade de Wisconsin descobriu que o gpt2-chatbot poderia realizar uma tarefa que outros modelos de IA líderes não poderiam. Dimitris Papailiopoulos pediu ao gpt2-chatbot para resolver um enigma matemático que envolvia aprender algumas regras inexplicitas. A IA geralmente tem dificuldades em responder a perguntas como essa.
No final das contas, ainda há muito pouca informação disponível sobre o gpt2-chatbot. No entanto, parece claro que um grande player está por trás desse modelo de IA. Nas próximas semanas, o criador e as origens do gpt2-chatbot provavelmente se tornarão públicos. Isso pode significar que um novo modelo de IA está surgindo ou talvez haja um novo desenvolvedor de IA na cena.