Anthropic Estabelece Um Novo Padrão de Ouro: Sua Vez, OpenAI

A Anthropic, uma startup fundada por ex-membros da OpenAI, afirma que seu novo chatbot, Claude 3, quebrou novas barreiras para o mundo da IA. O chatbot atualizado, lançado na segunda-feira, supera o ChatGPT e os modelos mais avançados do Google Gemini, potencialmente coroando um novo rei no mundo da IA. A Anthropic lançou três níveis – Opus, Sonnet e Haiku – que vão do mais ao menos capaz.

“Opus nos mostra os limites do que é possível com a IA generativa”, afirmou a Anthropic em um post de blog na segunda-feira. “Claude 3 Opus é nosso modelo mais inteligente, com o melhor desempenho do mercado em tarefas altamente complexas. Ele pode navegar em promptos abertos e cenários não vistos com fluência notável e compreensão humanizada.”

O lançamento de Claude 3 pela Anthropic reafirma a startup, liderada pelos irmãos Dario e Daniela Amodei, como líder mundial no espaço da IA. Os novos modelos estão equipados com a “IA Constitucional” da Anthropic, que tem como objetivo tornar os chatbots menos prejudiciais. No entanto, o Claude 3 tem taxas de recusa menores para perguntas controversas do que os modelos anteriores e agora está disponível a um preço competitivo.

Claude 3 se destaca principalmente em relação ao ChatGPT e Gemini na codificação, um dos casos de uso mais populares da IA. Claude Opus alcança uma taxa de sucesso de 85% na codificação de zero-shots, comparado com 67% do GPT-4 e 74% do Gemini. Claude também supera a concorrência quando se trata de raciocínio, resolução de problemas matemáticos e conhecimento básico (MMLU). No entanto, Sonnet e Haiku, que são mais baratos e mais rápidos, são competitivos com os modelos mais avançados da OpenAI e do Google.

Recursos como a IA Constitucional da Anthropic estão se tornando cada vez mais importantes no espaço. No mês passado, o CEO do Google, Sundar Pichai, pausou o Gemini por suas respostas controversas sobre raça, que ele chamou de “completamente inaceitáveis”.

Nos primeiros testes feitos pelo Gizmodo com o Claude Opus (preço de $20 por mês), o chatbot de IA se mostrou comparável a um líder do setor. O chatbot é capaz de raciocínio e resolução de problemas em nível avançado. O Claude 3 também lida com perguntas controversas com mais habilidade do que o Gemini e o ChatGPT.

No entanto, a Anthropic possui algumas limitações que outras empresas não têm. A empresa não oferece geração de imagens como alguns de seus concorrentes, o que está se tornando um padrão para chatbots de IA. O Claude também não possui conhecimento em tempo real ou a capacidade de navegar na web. Seu corte de conhecimento é em agosto de 2023.

A baixa taxa de recusa do Claude 3 é notável ao usar o chatbot. Ao contrário do Gemini, o chatbot da Anthropic consegue responder a perguntas difíceis sobre raça, ação afirmativa e tópicos políticos quentes com facilidade. Embora o chatbot não emita uma opinião, ele faz um trabalho melhor do que outros para apresentar uma resposta equilibrada. Essas salvaguardas foram um foco central para os fundadores da Anthropic e a principal razão pela qual deixaram a OpenAI.

O mundo das startups de IA está se tornando cada vez mais competitivo. A Anthropic se associou à Amazon e oferece seus serviços de chatbot de IA por meio do Amazon Bedrock, a plataforma de IA da gigante do varejo para seus Amazon Web Services. Na semana passada, a Microsoft anunciou uma nova parceria com a startup francesa Mistral, continuando sua parceria muito maior com a OpenAI.

A Anthropic enviou uma mensagem à concorrência com o lançamento do Claude, derrubando a OpenAI como líder de longa data no mundo da IA. Já se passou aproximadamente um ano desde que a OpenAI lançou o ChatGPT-4, então pode não demorar muito até termos uma resposta para o Claude 3 com o aguardado GPT-5.