Anthropic Diz Novo Modelo de IA Claude 3.5 Supera GPT-4 Omni

A Anthropic lançou o Sonnet Claude 3.5 na quinta-feira, que a startup de inteligência artificial diz superar seus modelos anteriores e o recém-lançado modelo GPT-4 Omni da OpenAI em várias métricas. A empresa também lançou Artifacts, um novo espaço de trabalho dinâmico dentro do Claude, onde os usuários podem editar e expandir os projetos de inteligência artificial do Claude, como um videogame de caranguejo jogável.

“Nosso objetivo com o Claude não é criar um LLM incrementalmente melhor, mas desenvolver um sistema de IA que possa trabalhar ao lado de pessoas e software de maneiras significativas”, disse o cofundador e CEO da Anthropic, Dario Amodei, em comunicado à imprensa. “Recursos como Artifacts são experimentos iniciais nesse sentido.”

Esta é a primeira versão da família de modelos 3.5 do Claude da Anthropic, que vem apenas três meses após o lançamento de seus modelos Claude 3. A Anthropic está lutando para acompanhar os lançamentos de produtos da OpenAI. Hoje, a Anthropic está lançando apenas a versão 3.5 de seu modelo intermediário Sonnet, mas a startup planeja lançar uma versão 3.5 do Haiku (seu modelo de nível de entrada) e Opus (sua versão mais capaz) ainda este ano. A startup também diz estar explorando recursos como busca na web e memória para futuros lançamentos.

O foco da Anthropic é lançar não apenas modelos melhores, mas mais recursos e capacidades para tornar sua IA mais útil. Com Artifacts, a Anthropic diz que os usuários podem criar projetos interativos dentro do Claude. Em uma demonstração, a startup mostra como você pode criar personagens e ícones dentro de um videogame de caranguejo de 8 bits gerado por IA e editar o projeto ao longo do caminho.

A Anthropic afirma que o Soneto Claude 3.5 é o seu modelo de visão mais forte até o momento, o que permite ao Claude ter um melhor desempenho em raciocínio visual, interpretação de gráficos e transcrição de texto de imagens imperfeitas. A Anthropic afirma que o Sonnet Claude 3.5 supera várias capacidades de visão do GPT-4 Omni, que apresentou impressionantes capacidades de visão no lançamento. Dizem que o Claude é supostamente melhor em entender visualmente gráficos, documentos e matemática. Caso contrário, a Anthropic diz que seu novo Claude geralmente supera o ChatGPT da OpenAI em codificação e raciocínio.

Vale ressaltar que a Anthropic diz que o Soneto Claude 3.5 faz um trabalho melhor em analisar o que responder e o que não responder. Os chatbots de IA se tornaram notórios por se recusarem a responder a certas perguntas. O Gizmodo fez uma profunda análise sobre a censura de IA alguns meses atrás e descobriu que o Claude da Anthropic se recusava a responder a muitas perguntas. Com o Claude 3.5, a Anthropic se sente confiante no julgamento do Claude em responder a perguntas inapropriadas ou potencialmente prejudiciais.