O Google afirmou em uma coletiva de imprensa na quarta-feira que seu mais recente modelo de IA, Gemini 1.5 Flash, é 20% mais rápido que o novo bot da OpenAI, o ChatGPT-4o.
O Google anunciou na quinta-feira que o Gemini 1.5 Flash agora está disponível para o público em geral. O chatbot de IA foi anunciado pela primeira vez na Google I/O em maio e esteve em prévia pública – o que significa que os clientes puderam testar o produto e fornecer feedback – desde o último mês. O Gemini 1.5 Flash pode analisar uma hora de vídeo, 11 horas de áudio ou mais de 700.000 palavras em uma única consulta, em vez de os usuários terem que dividir suas perguntas em partes. Em uma apresentação para jornalistas, o Google mostrou como o bot poderia analisar um vídeo de 14 minutos em um minuto.
O Google afirmou que o último bot de IA também é 40% mais rápido que o ChatGPT-3.5-turbo e tem uma maior capacidade de informação. Em outras palavras, os usuários podem incluir muito mais contexto – seja áudio, vídeo, código ou texto – em suas perguntas para o Gemini 1.5 Flash e, em troca, aparentemente obter respostas mais precisas.
“É o modelo mais rápido com a melhor opção de preço em termos de desempenho do mercado”, disse o CEO da Google Cloud, Thomas Kurian. O Gemini 1.5 Flash está disponível para desenvolvedores em uma capacidade limitada gratuitamente e, além disso, a preços variáveis, dependendo da quantidade de dados que os usuários desejam inserir.
O Gemini 1.5 Pro é cerca de 10 vezes mais caro, mas descrito pela Google como seu “melhor modelo geral”. Ele pode levar em consideração ainda mais contexto: 22 horas de áudio e 1,5 milhão de palavras. “Você pode raciocinar ao longo de toda a história de uma empresa, que poderia ser o equivalente a 10 anos de dados financeiros” em uma consulta, disse Kurian.
O Google afirmou que suas recentes atualizações para o Gemini 1.5 Flash, seu modelo principal Gemini 1.5 Pro e seu gerador de imagens Imagen 3, fazem do seu pacote de software de IA “a plataforma de IA generativa mais pronta para empresas” no mercado. Ele citou vários clientes empresariais que utilizam seus produtos, incluindo o UberEats, Moody’s e Shutterstock.
Esses clientes estão recorrendo ao Google em parte devido a uma atualização específica em sua IA: as capacidades aceleradas de “grounding”, anunciadas na quinta-feira. Os modelos Gemini agora mostram respostas ancoradas (por exemplo, anexadas) a uma fonte com um link. Essas respostas também recebem uma pontuação de fundamentação (por exemplo, confiabilidade).
Moody’s Analytics Chief Product Officer Nick Reed disse aos repórteres: “O Grounding é um processo bastante fundamental para poder usar a IA generativa em processos de tomada de decisão, particularmente em serviços financeiros.” A empresa de serviços financeiros é cliente do Google Gemini 1.5 Flash.
O Google afirmou que também lançará uma nova ferramenta de fundamentação específica do setor no terceiro trimestre, que permitirá que analistas financeiros, por exemplo, fundamentem suas consultas de IA com base em dados da Moody’s ou que especialistas jurídicos fundamentem perguntas em fontes da Thomson Reuters.
Por números:
60%: Aproximadamente o quanto os lucros do Google aumentaram no primeiro trimestre, em parte graças à IA.
22: Horas de áudio que o Gemini 1.5 Pro pode analisar.
1: Minuto que o Gemini 1.5 Flash leva para analisar um vídeo de 14 minutos.
20%: Quanto mais rápido o Gemini 1.5 Flash é em comparação com o ChatGPT-4o, de acordo com o Google.