Ferramenta de IA Gemini da Google Pode Analisar suas Fotos e Recuperar o Número da sua Placa de Licença

O CEO do Google, Sundar Pichai, anunciou na terça-feira uma ferramenta de IA que pode muito bem acalmar as súplicas de cada jovem que viu um pai rolar fotos no smartphone por longos minutos em busca de “aquela vez em que…”.

A nova funcionalidade Gemini, Ask Photos, permite aos usuários solicitar ao assistente de IA que encontre fotos. As perguntas podem incluir “Mostre-me a melhor foto de cada parque nacional que visitei” ou “Quais temas tivemos para as festas de aniversário da Lena?”. Em resposta, o chatbot enviará fotos relevantes, “poupando todo esse rolar”, disse a empresa durante sua conferência anual de desenvolvedores Google I/O.

Pichai demonstrou como os clientes também podem usar Ask Photos para recuperar informações específicas de suas fotos. Por exemplo, ele exibiu que um usuário pode pedir ao robô para lembrá-lo da placa do seu carro; a IA analisará as fotos do seu carro dentro do rolo da câmera para gerar uma resposta. “Ela sabe quais carros aparecem com frequência, identifica qual é o seu e apenas informa o número da placa”, disse Pichai.

Mas quão segura é uma IA que vasculha nossas fotos? O Google abordou “[E]mbora Ask Photos seja experimental e não vá acertar tudo, empregamos camadas de proteção e modelos de IA para ajudar a garantir que as respostas sejam seguras e adequadas”, escreveu o Google em seu anúncio online do produto.

Mas também acrescentou que a ferramenta lembrará das conversas, usando correções ou informações adicionais fornecidas para se aprimorar no futuro.

O Google planeja lançar a funcionalidade neste verão “com mais capacidades por vir”, disse Pichai.

O chefe do Google também fez vários outros anúncios de novos recursos de IA do Google, incluindo o lançamento oficial de visões gerais de IA na Pesquisa Google, um novo gerador de imagens Imagen 3 e um novo chip de IA chamado Trillium. Também foi demonstrado um assistente de IA que pode conversar através do telefone ou óculos inteligentes do usuário.