Anthropic estabelece um novo padrão-ouro: sua jogada, OpenAI

A startup chamada Anthropic, fundada por ex-membros da OpenAI, afirma que seu novo chatbot, Claude 3, quebrou novos paradigmas para o mundo da IA. O chatbot atualizado, lançado na segunda-feira, supera o ChatGPT e os modelos mais avançados do Google Gemini, potencialmente coroando um novo rei no mundo da IA. A Anthropic lançou três níveis – Opus, Sonnet e Haiku – que variam de mais a menos capazes.

“Opus nos mostra os limites do que é possível com a IA generativa”, afirmou a Anthropic em uma postagem de blog na segunda-feira. “Claude 3 Opus é o nosso modelo mais inteligente, com melhor desempenho do mercado em tarefas altamente complexas. Ele pode lidar com prompts de final aberto e cenários inéditos com fluência notável e entendimento semelhante ao humano”.

O lançamento do Claude 3 pela Anthropic reafirma a startup, liderada pelos irmãos Dario e Daniela Amodei, como líder mundial no espaço de IA. Os novos modelos estão equipados com a “IA Constitucional” da Anthropic, que tem como objetivo tornar os chatbots menos prejudiciais. No entanto, o Claude 3 tem taxas de recusa mais baixas para perguntas controversas do que os modelos anteriores e agora está disponível a um preço competitivo.

O Claude 3 se destaca especialmente em relação ao ChatGPT e Gemini na codificação, um dos casos de uso iniciais mais populares da IA. O Claude Opus alcança uma taxa de sucesso de 85% na codificação de zero-shot, em comparação com 67% do GPT-4 e 74% do Gemini. O Claude também supera a concorrência quando se trata de raciocínio, resolução de problemas matemáticos e conhecimento básico (MMLU). No entanto, o Sonnet e o Haiku, mais baratos e rápidos, também são competitivos com os modelos mais avançados da OpenAI e do Google.

Recursos como a IA Constitucional da Anthropic estão se tornando cada vez mais importantes no espaço. No mês passado, o CEO do Google, Sundar Pichai, pausou o Gemini por suas respostas controversas sobre raça, que ele chamou de “completamente inaceitáveis”.

Em nossos primeiros testes com o Claude Opus (com preço de $20 por mês), o chatbot de IA da Gizmodo se mostra comparável a um líder do setor. O chatbot é capaz de raciocínio e resolução de problemas de alto nível. O Claude 3 também lida com perguntas controversas com mais graça do que o Gemini e o ChatGPT.

No entanto, a Anthropic possui algumas limitações que outras empresas não têm. A empresa não oferece geração de imagem como alguns de seus concorrentes, o que está se tornando um padrão para os chatbots de IA. O Claude também não possui conhecimento em tempo real ou a capacidade de navegar na internet. Sua data limite de conhecimento é agosto de 2023.

A baixa taxa de recusa do Claude 3 é perceptível ao usar o chatbot. Ao contrário do Gemini, o chatbot da Anthropic pode responder a perguntas difíceis sobre raça, ação afirmativa e tópicos políticos quentes com facilidade. Embora o chatbot não emita uma opinião, ele faz um trabalho melhor do que outros ao elaborar uma resposta equilibrada. Essas salvaguardas foram foco central dos fundadores da Anthropic e a principal razão pela qual deixaram a OpenAI.

O mundo das startups de IA está se tornando cada vez mais competitivo. A Anthropic firmou parceria com a Amazon e oferece seus serviços de chatbot de IA por meio do Amazon Bedrock, a plataforma de IA da gigante do varejo para seus Serviços Web da Amazon. Na semana passada, a Microsoft anunciou uma nova parceria com a startup francesa de IA, Mistral, mantendo sua parceria muito maior com a OpenAI.

A Anthropic enviou uma mensagem à concorrência com o lançamento do Claude, destronando a OpenAI como líder de longa data no mundo da IA. Já se passou cerca de um ano desde que a OpenAI lançou o ChatGPT-4, então talvez não demore para termos uma resposta ao Claude 3 com o aguardado GPT-5.