Anthropic Afirma Que Novo Modelo de Inteligência Artificial Claude 3.5 Supera GPT-4 Omni

Anthropic lançou Claude 3.5 Sonnet na quinta-feira, o que a startup de IA diz superar seus modelos de IA anteriores e o GPT-4 Omni da OpenAI lançado recentemente em várias métricas. A empresa também lançou Artifacts, um novo espaço de trabalho dinâmico dentro de Claude onde os usuários podem editar e construir sobre os projetos de IA de Claude, como um jogo de vídeo jogável sobre caranguejos.

“Nosso objetivo com Claude não é criar um LLM incrementalmente melhor, mas desenvolver um sistema de IA que possa trabalhar ao lado de pessoas e software de maneiras significativas,” disse o co-fundador e CEO da Anthropic, Dario Amodei, em um comunicado à imprensa. “Recursos como Artifacts são experimentos iniciais nessa direção.”

Essa é a primeira versão da família de modelos Claude 3.5 da Anthropic, que vem apenas três meses após o lançamento de seus modelos Claude 3. Anthropic está lutando para acompanhar os lançamentos de produtos da OpenAI. Hoje, a Anthropic está lançando a versão 3.5 de seu modelo de nível intermediário Sonnet, mas a startup planeja lançar ainda este ano uma versão 3.5 do modelo de nível de entrada Haiku e do modelo mais capaz, Opus. A startup também diz estar explorando recursos como busca na web e memória para futuros lançamentos.

O foco da Anthropic está em lançar não apenas modelos melhores, mas mais recursos e capacidades para tornar sua IA mais útil. Com Artifacts, a Anthropic diz que os usuários podem criar projetos interativos dentro de Claude. Em uma demonstração, a startup mostra como é possível criar personagens e ícones em um jogo de vídeo sobre caranguejos gerado por IA em 8 bits, e editar o projeto no caminho.

A startup de IA diz que o Claude 3.5 Sonnet é o seu modelo de visão mais forte até o momento, o que permite que Claude tenha um melhor desempenho em raciocínio visual, interpretação de gráficos e transcrição de texto a partir de imagens imperfeitas. A Anthropic afirma que o Claude 3.5 Sonnet supera várias capacidades de visão da GPT-4 Omni, que estreou impressionantes capacidades de visão no lançamento. Claude supostamente é melhor em entender visualmente gráficos, documentos e matemática. Do contrário, a Anthropic diz que seu novo Claude geral supera o ChatGPT da OpenAI em programação e raciocínio.

De maneira notável, a Anthropic diz que o Claude 3.5 Sonnet faz um melhor trabalho ao analisar o que deve e o que não deve responder. Os chatbots de IA tornaram-se notórios por se recusarem a responder certas perguntas. A Gizmodo fez uma investigação aprofundada sobre censura de IA alguns meses atrás e descobriu que o Claude da Anthropic se recusava a responder a muitas perguntas. Com Claude 3.5, a Anthropic se sente confiante no julgamento do Claude em responder a perguntas inapropriadas ou potencialmente prejudiciais.