O Google lança o chatbot Gemini 1.5 Pro com novas funcionalidades de IA
O Google apresentou oficialmente a nova — e mais potente — versão do seu chatbot de IA (Inteligência Artificial), o Gemini 1.5 Pro — sua plataforma de inteligência artificial. Agora, o chatbot é capaz de processar conteúdo em áudio e vídeo. Ou seja, ele pode funcionar sem a necessidade do usuário ter que digitar comandos em texto.
A aplicação da nova IA do Google no dia a dia
O Gemini 1.5 Pro veio a público durante o Google Cloud Next 2024, evento onde a gigante das buscas anunciou novas soluções de IA para as plataformas do Workspace — a versão paga das ferramentas do Google. Por enquanto, apenas os membros do Vertex AI (serviço que auxilia programadores no desenvolvimento de aplicativos) poderão acessar a nova versão.
A big tech reforça que a IA está muito mais “inteligente”. Isso porque ele é capaz de compreender instruções mais complexas e entender textos muito longos, sem precisar fazer ajustes no modelo. Isso inclui 1 hora de vídeo, 11 horas de áudio, bases de código com mais de 30.000 linhas de código ou mais de 700 mil palavras em um único fluxo.
Outras inovações do Gemini
Vale ressaltar que o Gemini 1.5 Pro é apenas uma das muitas novidades apresentadas durante o Next 2024. Outra função revelada pela empresa é o Imagen 2, um modelo de geração de imagens com base em prompts de texto — rival do DALL-E.
A principal novidade do modelo de imagem são os recursos “inpainting” e “outpainting”, que lhe permite adicionar ou remover elementos de imagens. Porém, para evitar problemas de desinformação e geração de fake news — principalmente durante um cenário de eleições –, o Google também apresentou também a marca d’água invisível SynthID, que permite averiguar sua real origem.