O Google lançou a nova versão do seu chatbot de IA, o Gemini 1.5 Pro, durante o evento Google Cloud Next. Esse chatbot é capaz de processar conteúdo em áudio e vídeo, sem a necessidade de comandos em texto. A IA tornou-se mais inteligente, conseguindo compreender instruções complexas e textos longos sem ajustes no modelo. Além disso, a nova versão promete um desempenho superior ao Gemini Ultra.
Com essa atualização, a IA pode ser utilizada para análises multimodais, como transcrição de áudios, traduções e resumos de informações. No ambiente corporativo, é capaz de automatizar o processo de ata de reuniões online. Fora desse contexto, pode identificar eventos específicos em vídeos, como um “Gol!” em uma partida de futebol, gerando estatísticas automaticamente.
O Google também apresentou outras novidades, como o Imagen 2, um modelo de geração de imagens, e o Google Vids, um aplicativo para criação de vídeos. A empresa destaca a utilização da IA para melhorar o atendimento médico, agilizar cadeias de suprimentos e otimizar sistemas automatizados de atendimento ao cliente.
Essas ferramentas suportarão diversos idiomas, incluindo o português, e espera-se que sejam lançadas oficialmente a partir de junho. O Google busca competir com ChatGPT da OpenAI e consolidar suas ferramentas de IA no mercado de tecnologia, após algumas polêmicas envolvendo seus serviços.