Anthropic Afirma que Novo Modelo de IA Claude 3.5 Supera GPT-4 Omni

A Anthropic lançou o Claude 3.5 Sonnet na quinta-feira, que a startup de IA diz superar seus modelos de IA anteriores e o recém-lançado GPT-4 Omni da OpenAI em várias métricas. A empresa também lançou os Artifacts, um novo espaço de trabalho dinâmico dentro do Claude, onde os usuários podem editar e desenvolver projetos de IA do Claude, como um jogo de vídeo jogável de caranguejo.

“Nosso objetivo com o Claude não é simplesmente criar um LLM incrementalmente melhor, mas desenvolver um sistema de IA que possa trabalhar ao lado de pessoas e software de maneira significativa”, disse o co-fundador e CEO da Anthropic, Dario Amodei, em comunicado à imprensa. “Recursos como Artifacts são experimentos iniciais nessa direção.”

Esta é a primeira versão da família de modelos Claude 3.5 da Anthropic, que vem apenas três meses após o lançamento de seus modelos Claude 3. A Anthropic está lutando para se manter atualizada com os lançamentos de produtos da OpenAI. Hoje, a Anthropic está apenas lançando a versão 3.5 de seu modelo de nível intermediário Sonnet, mas a startup planeja lançar uma versão 3.5 do Haiku (seu modelo de nível básico) e Opus (sua versão mais capaz) ainda este ano. A startup também diz que está explorando recursos como busca na web e memória para futuros lançamentos.

O foco da Anthropic é lançar não apenas modelos melhores, mas mais recursos e capacidades para tornar sua IA mais útil. Com Artifacts, a Anthropic diz que os usuários podem criar projetos interativos dentro do Claude. Em uma demonstração, a startup mostra como você pode criar personagens e ícones em um jogo de vídeo de caranguejo de 8 bits gerado por IA e editar o projeto no caminho.

A startup de IA diz que o Claude 3.5 Sonnet é seu modelo de visão mais forte até o momento, o que permite que o Claude tenha um melhor desempenho em raciocínio visual, interpretação de gráficos e transcrição de texto a partir de imagens imperfeitas. A Anthropic afirma que o Claude 3.5 Sonnet supera várias capacidades de visão do GPT-4 Omni, que estreou impressionantes capacidades de visão no lançamento. Supostamente, o Claude é melhor em entender visualmente gráficos, documentos e matemática. Além disso, a Anthropic diz que o novo Claude geralmente supera o ChatGPT da OpenAI em codificação e raciocínio.

É importante destacar que a Anthropic diz que o Claude 3.5 Sonnet faz um trabalho melhor em analisar o que responder e o que não responder. Os chatbots de IA se tornaram notórios por se recusarem a responder a certas perguntas. O Gizmodo fez uma análise aprofundada sobre a censura de IA há alguns meses e descobriu que o Claude da Anthropic se recusava a responder muitas perguntas. Com o Claude 3.5, a Anthropic se sente confiante no julgamento do Claude em responder a perguntas inadequadas ou potencialmente prejudiciais.