Nesta história, a Google apresentou seu modelo mais capacitado até o momento para impulsionar a “nova era de agências” da inteligência artificial.
A gigante da tecnologia introduziu o Gemini 2.0, que “nos permitirá construir novos agentes de IA que nos aproximam da nossa visão de um assistente universal”, disse o CEO da Google, Sundar Pichai na quarta-feira, acrescentando que a empresa está trabalhando para implementar o novo modelo em todos os seus produtos. Os agentes de IA são softwares que podem completar tarefas complexas autonomamente para um usuário.
O Gemini 2.0 possui novas capacidades multimodais, incluindo saída de imagem e áudio nativos, disse Pichai. A Google lançou o Gemini 1.0 em dezembro passado, que a empresa afirmou ser o primeiro modelo “nativamente multimodal”, ou seja, ele poderia processar e responder a consultas de texto, vídeo, imagem, áudio e código.
Desenvolvedores e testadores serão os primeiros a ter acesso ao 2.0, enquanto todos os usuários do Gemini terão acesso ao modelo experimental Gemini 2.0 Flash. O modelo Flash se baseia no Gemini 1.5 Flash, lançado pela Google em julho como seu modelo mais rápido e eficiente em termos de custo.
A Google adicionará as capacidades de raciocínio do Gemini 2.0 ao recurso AI Overviews, que Pichai disse agora alcança um bilhão de pessoas e está “rapidamente se tornando um dos recursos de pesquisa mais populares”. Com o Gemini 2.0, os AI Overviews poderão resolver consultas avançadas de vários passos, como equações matemáticas e perguntas multimodais.
Os testes limitados para o Gemini 2.0 nos AI Overviews começaram nesta semana, disse Pichai, mas o recurso de raciocínio será expandido para mais usuários no início do próximo ano. O modelo de raciocínio roda no chip de IA de 6ª geração personalizado da Google, Trillium, que se tornou disponível para clientes do Google Cloud na quarta-feira. O novo chip oferece 4 vezes melhor desempenho e é 67% mais eficiente em termos energéticos do que seu antecessor, de acordo com a empresa.
Pichai também anunciou um novo recurso do Gemini chamado Deep Research, que pode “atuar como um assistente de pesquisa” utilizando raciocínio avançado e capacidades de contexto longo. O Deep Research, que está disponível no Gemini Advanced, pode compilar relatórios de pesquisa em nome de um usuário.