Alex Barbosa
15 de maio de 2024
Inteligência Artificial

Conjuntos Antropicos estabelecem um novo padrão ouro: Sua jogada, OpenAI.

Anthropic, uma startup formada por ex-membros da OpenAI, afirma que seu novo chatbot, Claude 3, quebrou novos paradigmas para o mundo da IA. O chatbot atualizado, lançado na segunda-feira, supera o ChatGPT e os modelos mais avançados do Google Gemini, potencialmente coroando um novo rei no mundo da IA. A Anthropic lançou três níveis – Opus, Sonnet e Haiku – que variam do mais ao menos capaz.

“Opus nos mostra os limites do que é possível com IA generativa”, disse a Anthropic em um post de blog na segunda-feira. “Claude 3 Opus é nosso modelo mais inteligente, com melhor desempenho de mercado em tarefas altamente complexas. Ele pode lidar com solicitações sem limites e cenários nunca vistos com notável fluidez e entendimento humano.”

O lançamento do Claude 3 pela Anthropic reafirma a startup, liderada pelos irmãos Dario e Daniela Amodei, como líder mundial no espaço de IA. Os novos modelos estão equipados com a “IA Constitucional” da Anthropic, que tem como objetivo tornar os chatbots menos prejudiciais. No entanto, o Claude 3 tem taxas de recusa mais baixas para perguntas controversas do que os modelos anteriores e agora possui um ponto de preço competitivamente baixo.

O Claude 3 se destaca principalmente em relação ao ChatGPT e Gemini na codificação, um dos casos de uso mais populares da IA. Claude Opus tem uma taxa de sucesso de 85% em codificação sem instruções, em comparação com 67% do GPT-4 e 74% do Gemini. O Claude também supera a concorrência quando se trata de raciocínio, resolução de problemas matemáticos e conhecimento básico (MMLU). No entanto, Sonnet e Haiku, que são mais baratos e mais rápidos, também são competitivos com os modelos mais avançados da OpenAI e do Google.

Recursos como a IA Constitucional da Anthropic estão se tornando cada vez mais importantes no espaço. No mês passado, o CEO do Google, Sundar Pichai, pausou o Gemini por suas respostas controversas sobre raça, que ele chamou de “totalmente inaceitáveis”.

Em testes iniciais do Gizmodo com o Claude Opus (com preço de $20 por mês), o chatbot de IA se mostrou comparável a um líder da indústria. O chatbot é capaz de raciocínio e resolução de problemas de alto nível. O Claude 3 também lida com perguntas controversas com mais graça do que o Gemini e o ChatGPT.

No entanto, a Anthropic tem algumas limitações que outras empresas não têm. A empresa não oferece geração de imagens como alguns de seus concorrentes, que está se tornando um padrão para chatbots de IA. O Claude também não possui conhecimento ao vivo ou a capacidade de navegar na web. Seu corte de conhecimento é agosto de 2023.

A baixa taxa de recusa do Claude 3 é perceptível ao usar o chatbot. Ao contrário do Gemini, o chatbot da Anthropic pode responder a perguntas difíceis sobre raça, ação afirmativa e tópicos políticos quentes com facilidade. Embora o chatbot não produza uma opinião, ele faz um trabalho melhor do que outros em apresentar uma resposta equilibrada. Essas salvaguardas foram um foco central dos fundadores da Anthropic e a principal razão pela qual saíram da OpenAI.

O mundo das startups de IA está se tornando cada vez mais competitivo. A Anthropic se associou à Amazon e oferece seus serviços de chatbot de IA por meio do Amazon Bedrock, a plataforma de IA da gigante do varejo para seus Serviços Web da Amazon. Na semana passada, a Microsoft anunciou uma nova parceria com a startup francesa de IA Mistral, enquanto continua sua parceria muito maior com a OpenAI.

A Anthropic enviou uma mensagem à concorrência com o lançamento do Claude, destronando a OpenAI como líder de longa data no mundo da IA. Já se passou aproximadamente um ano desde que a OpenAI lançou o ChatGPT-4, então pode não demorar muito até termos uma resposta ao Claude 3 com o aguardado GPT-5.

Alex Barbosa

Apaixonado por tecnologia e inovações. Compartilho meu conhecimento e insights sobre o futuro, desde inteligência artificial até realidade virtual. Junte-se a mim nesta jornada para desvendar as maravilhas da tecnologia e seu impacto no mundo.