O Google lançou oficialmente a nova versão do seu chatbot de IA, o Gemini 1.5 Pro, durante o Google Cloud Next 2024. Essa atualização traz uma capacidade aprimorada do chatbot em processar conteúdo em áudio e vídeo, sem a necessidade do usuário digitar comandos em texto. A novidade foi anunciada junto com outras soluções de IA para o Workspace, a versão paga das ferramentas do Google. A Big Tech destaca que a nova IA do Gemini está mais inteligente, capaz de compreender instruções complexas e entender textos extensos sem ajustes no modelo. O novo modelo promete uma performance superior ao Gemini Ultra.
Com a atualização do Gemini, a IA pode ser utilizada para análises multimodais, como transcrição de áudio, tradução, análise de dados e resumo de informações de videochamadas. Além disso, a IA pode automatizar o registro dos assuntos mais importantes de reuniões online ou responder perguntas durante chamadas no Google Meet. Fora do ambiente corporativo, a ferramenta pode identificar eventos específicos em vídeos esportivos ou auxiliar médicos no atendimento aos pacientes.
Outra novidade apresentada foi o Imagen 2, um modelo de geração de imagens com base em prompts de texto. A IA também pode ser utilizada no Google Vids, um aplicativo de criação de vídeos para apresentações, utilizando recursos como escrita de scripts e criação de storyboards. A tecnologia também pode auxiliar na escrita de e-mails, traduções em diferentes idiomas e planejamento de viagens.
O Google pretende lançar oficialmente essas ferramentas a partir de junho, com suporte para diversos idiomas, incluindo o português. A empresa busca competir com o ChatGPT da OpenAI e consolidar suas ferramentas de IA no mercado de tecnologia, especialmente no segmento mobile.
Apesar dos avanços, o Google enfrenta polêmicas, como o incidente envolvendo seu gerador público de imagens que gerou resultados historicamente imprecisos e foi temporariamente suspenso. No entanto, a empresa mantém o compromisso de tornar a IA útil para todos, visando melhorar a vida de um grande número de pessoas.