Um novo chatbot de IA chamado “gpt2-chatbot” surpreendeu esta semana ao ficar disponível em um grande site de benchmarking de modelos de linguagem, LMSYS Org. Sua origem é desconhecida, mas muitos consideram que ele possui capacidades semelhantes ao GPT-4 da OpenAI. Isso coloca o gpt2-chatbot em uma classe rara de modelos de IA que apenas um punhado de desenvolvedores em todo o mundo foram capazes de alcançar.
Ethan Mollick, um professor pesquisador de inteligência artificial na Wharton School da Universidade da Pensilvânia, mencionou em um tweet na segunda-feira que “ninguém sabe quem criou ou o que é, mas estive brincando um pouco com ele e parece estar no mesmo nível de habilidade que o GPT-4”.
No entanto, ao atingir seu pico de popularidade, o chatbot desapareceu na terça-feira à tarde. Uma mensagem na página inicial do site LMSYS dizia “gpt2-chatbot não está disponível no momento”. Posteriormente, um tweet da organização confirmou que o chatbot foi retirado do ar devido a um “tráfego inesperadamente alto”. No entanto, a LMSYS afirma que “aguardem mais lançamentos”.
Comunidades online de IA ficaram alvoroçadas com o gpt2-chatbot anônimo. Algumas pessoas afirmaram que ele quase codificou um clone perfeito do jogo para celular Flappy Bird. Outro usuário disse que resolveu um problema da Olimpíada Internacional de Matemática de uma vez. Em longos tópicos no Reddit, os usuários especulam selvagemente sobre as origens do gpt2-chatbot e debatem se ele é da OpenAI, Google ou Anthropic. Não há evidências para essas alegações, mas tweets do CEO da OpenAI Sam Altman e outros executivos apenas adicionaram combustível ao fogo.
Anteriormente, era possível experimentar o gpt2-chatbot no site da LMSYS Org. Ele estava disponível no “Bate-papo Direto” ou na opção “Arena (lado a lado)” no menu suspenso. A LMSYS Org afirma em seu blog de políticas que certos desenvolvedores de modelos de IA podem testar modelos anônimos não lançados antes de um lançamento mais amplo, levando muitos a acreditar que o gpt2-chatbot é um modelo anônimo de um grande desenvolvedor de IA.
A LMSYS Org e a OpenAI não responderam imediatamente ao pedido de comentário do Gizmodo.
Em testes limitados do Gizmodo, descobrimos que o gpt2-chatbot possui capacidades semelhantes aos principais modelos de IA da Anthropic e da OpenAI. Ele exibiu comportamentos exclusivos de modelos de linguagem grandes avançados, raciocinando bem e elaborando planos detalhados para tarefas complicadas. Aqui estão alguns exemplos comparando o gpt2-chatbot (esquerda) e o modelo Claude Opus da Anthropic (direita).
Um professor de engenharia da computação na Universidade de Wisconsin descobriu que o gpt2-chatbot conseguia realizar uma tarefa que outros principais modelos de IA não conseguiam. Dimitris Papailiopoulos pediu ao gpt2-chatbot para resolver um enigma matemático que envolvia aprender algumas regras implícitas. A inteligência artificial geralmente tem dificuldade em responder a perguntas desse tipo.
No geral, há muito pouca informação disponível sobre o gpt2-chatbot até agora. No entanto, parece claro que um grande player está por trás deste modelo de IA. Nas próximas semanas, o criador e as origens do gpt2-chatbot provavelmente se tornarão públicas. Isso pode significar que um novo modelo de IA está no horizonte ou talvez haja um novo desenvolvedor de IA surgindo.