Google’s New Gemini AI Tool Can Analyze Your Photos and Retrieve Your License Plate Number

O CEO do Google, Sundar Pichai, anunciou na terça-feira uma ferramenta de IA que poderia muito bem acalmar os pedidos de cada jovem que já viu um pai navegar por fotos em seus smartphones por minutos a fio em busca de “aquela vez em que…”.

O novo recurso Gemini, chamado Ask Photos, permite que os usuários solicitem ao assistente de IA que encontre fotos. As solicitações podem incluir “Mostre-me a melhor foto de cada parque nacional que eu visitei” ou “Quais temas tivemos nas festas de aniversário da Lena?”. Em resposta, o chatbot irá conversar com fotos relevantes, “poupando você de toda essa rolagem”, disse a empresa em seu anúncio durante sua conferência anual para desenvolvedores Google I/O.

Pichai demonstrou como os clientes também podem usar o Ask Photos para recuperar informações específicas de suas fotos. Por exemplo, ele exibiu que um usuário pode pedir ao chatbot para lembrá-lo do número da placa de seu carro; a IA irá analisar as fotos de seu carro em sua galeria para gerar uma resposta. “Ela identifica os carros que aparecem com frequência, triângula qual é o seu, e apenas diz qual é a placa”, disse Pichai.

Mas quão seguro é uma IA que examina nossas fotos? O Google abordou, “[M]esmo que o Ask Photos seja experimental e não acerte tudo, empregamos camadas de salvaguardas e modelos de IA para ajudar a garantir que as respostas sejam seguras e apropriadas”, escreveu o Google em seu anúncio online do produto.

Mas também acrescentou que a ferramenta lembrará conversas, usando correções ou informações extras que você fornecer para se treinar para o futuro.

O Google planeja lançar o recurso neste verão “com mais capacidades por vir”, disse Pichai.

O CEO do Google também fez vários outros anúncios de novos recursos de IA do Google, incluindo o lançamento oficial de visões gerais de IA na Pesquisa do Google, um novo gerador de imagens Imagen 3 e um novo chip de IA chamado Trillium. Também demonstrou um assistente de IA que pode conversar por meio de um telefone ou óculos inteligentes do usuário.